对情绪可感知度达85%，讯飞推“超拟人交互”

快讯 2024-09-03 08:39:24

来源：科学网责任编辑：李琦

　　8月30日，科大讯飞星火极速超拟人交互技术正式上线讯飞星火APP，率先面向全社会开放体验。根据官方介绍，星火极速超拟人交互在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现重大突破，让整体交互体验更自然、更具情感。

　　《中国科学报》记者第一时间在讯飞星火APP上体验了该功能。可以看到，星火极速超拟人交互响应速度很快，支持随时打断;可以识别不同的情绪并呈现有代入符合情境的对话和回复，能觉察到其在有意减少“机械感”。

　　科大讯飞研究院常务副院长高建清介绍说，极速响应是确保一切体验的基础，也是区别于其它语音产品的关键能力。他解释说，“端到端”技术框架是实现极速响应的重点，该技术通过将此前级联方案升级为统一神经网络，直接实现语音到语音的“端到端”建模，从而大幅缩短响应时间，做到了真正的极速。

　　至于快速打断功能，高建清说，遇到错答、啰嗦回复等情况，立即打断是人的生理本能。但快速打断及响应其实是个极其复杂的工程问题，需要去判定何时打断、何时不应打断。“我们通过技术创新与强化底座认知能力，解决了打断和响应时间平衡的问题。”

星火极速超拟人语音交互技术路线图。科大讯飞供图

　　人类语言具有独特的情绪感染力，能够传达复杂的情感和思想。但长久以来，智能语音与自然语言处理技术偏重于针对“内容”模块下功夫，比如能“听懂”更多的语种，“解答”更多的问题，缺少拟人化的对话方案。

　　高建清表示，想要获得拟人化的对话体验，需要“内容”与“情绪”等模块协同作用。而大模型时代的到来，恰好能让不同的模块化功能进行“大统一”。他对记者解释道：“以往语音交互系统都是不同的模块，比如语音识别、语音合成和大语言模型。而科大讯飞星火极速超拟人交互技术基于端到端大模型框架，结合讯飞多维度语音属性解耦表征训练模块，从而可实现情感、方言、韵律、音色等的可控，最终实现了对语音交互的拟人化升级。”

　　“我们将一万多条带明确情绪色彩的语音测试语音大模型，结果有8500多条回复能匹配相应的情绪。”高建清告诉《中国科学报》，讯飞星火语音大模型的超拟人功能，对多种情绪的可感知度达到85%以上，可使对话声音真实度、拟人度更强。

　　他认为，共情力对于大模型是一项重要的基础能力，或许在未来的人形机器人身上，我们将看到更具共情力的具象表达。他进一步提出，目前系统暂时不能使用表情，但未来如果将表情、声音内容与声音情绪三者结合在一起，将会是一条可行的新路径。

人类人工智能 AI 情绪讯飞超拟人交互

免责声明：以上内容为本网转自其它媒体，相关信息仅为传递更多信息之目的，不代表本网观点、亦不代表本网站赞同其观点或证实其内容的真实性。如有侵权请联系本网删除。

上一篇：这家“教授创业公司”官宣完成近5亿元A轮融资

下一篇：发展“大交通”学科体系，同济大学成立新学院

您可能感兴趣的文章

评测

华为MateBook 13 2020款评测：超值的2K触控全面屏

华为畅享10e评测：超大电池续航可观！

骁龙855 Plus横扫千军！黑鲨游戏手机2 Pro评测：吃鸡半小时不烫手

原创

Aura Plus旗舰版京东首发，成者生态链再添扫描仪新成员
近日,成者再次推出新款扫描仪--Aura Plus旗舰版。
北极光科技网领略炫彩科技
北极光科技网于2018年正式上线。秉承“专注、沟通、领先”的媒体理念。
2019年用哪个网盘看这一篇横评就够了
可是,就在小编准备大干一场的时候,发现以前保存的资料零七八碎,散乱不堪;如何把他们放到同一网盘里规规矩矩地归纳备份起来,就成为了新年选择的重中之重。

产品

搜狗发布AI录音笔新品推动录音笔行业智能化进程
今天，搜狗公司正式发布S1、E1两款AI录音笔新品，还与故宫宫廷文化合作推出了S1和C1 Pro两款产品的故宫宫廷联名款。
宝马纯电动IX3低伪谍照曝光：封闭式双肾格栅续航超400KM
和奔驰、奥迪等豪华品牌相比，宝马近些年来在电动车上的速度要慢了不少。
标致508 Sport Engineered官图发布：马力500匹百公里4.3秒！
标致作为法系车的代表车企，虽然较早的进入中国市场，但在国内的品牌运营方面同大众、丰田等头部车企存在一定的差距，导致如今销量也是每况愈下，在国内车市的存在感也越来越弱。

热门阅读