关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者3638人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《四喜》的妈圈生存指南:没有全福,只有幸存

仙女事件簿 浏览 3425

涉疫邮轮感染病例増至8人已有3人病逝 邮轮曾去过南极

极目新闻 浏览 31083

欧阳明高警示:中国车企转型需防范“欲速不达”

观察者网 浏览 1619

认真生活的18个锦囊妙计:

黎贝卡的异想世界 浏览 5745

再见了沈腾,再见了贾玲,再见了沙溢!活得好好的已经被大家怀念

阿雹娱乐 浏览 2979

美女克拉拉官宣离婚,6年豪门婚姻告终

代军哥哥谈娱乐 浏览 3740

伊利契奇:有人出钱让我讲述经历;加斯佩里尼让我突破极限

懂球帝 浏览 3814

普京:若使用"战斧"导弹袭击俄领土 将招致惊人回应

环球网资讯 浏览 3699

公募基金业绩比较基准迎规范,证监会、中基协公开征求意见

华夏时报 浏览 3562

公安分局公示的三个监督电话打不通 官方回应

大风新闻 浏览 8232

新华鲜报|引导AI发展!网络安全法完成修改

新华社 浏览 3617

从“百模大战”到“百镜大战”,AI眼镜成新焦点丨一克商评

封面新闻 浏览 3508

纯爽片,真用心,值得被更多人看见!

吐槽电影院 浏览 2011

“装修一哥”绝境重生,国资输血7亿,7000债主表决通过重整计划

壹只灰鸽子 浏览 2854

小个子女生冬天怎么穿衣?上宽下紧、体现曲线,显高显瘦舒适

静儿时尚达人 浏览 2976

股市:更大的想象空间来了

小白读财经 浏览 2471

曾炒到1600元/粒的"中药茅"大跌价 公司市值蒸发1800亿

每日经济新闻 浏览 9340

运动化版本 斯柯达Epiq Sportline谍照曝光

车质网 浏览 227

美的与华为强强联合,共拓AI领域创新生态

正解局 浏览 4545

某券商首席炒黄金期货大赚14亿?本人报警了

财通社 浏览 2898

2000元抵4000元 阿维塔12四激光版预售

网易汽车 浏览 3718
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1