关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者3635人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深圳水贝“杰我睿”最新进展:有消费者收到兑付方案,20g黄金+9000多元余额,兑付本金4856元

每日经济新闻 浏览 2474

Thinking Machines人事风波全复盘:冲刺500亿美元估值添变数

DeepTech深科技 浏览 2579

从口袋PC到智能座舱:华为新品矩阵亮相2025中国移动全球合作伙伴大会 解码智慧生活

快科技 浏览 3726

不露腿也想穿好看,最关键的是这一点

黎贝卡的异想世界 浏览 2555

贝拉尔多辟谣离队传闻:在巴黎非常开心,会全力以赴实现目标

懂球帝 浏览 3463

今年以来最亮彗星现身天际,它的名字叫“莱蒙”

新华社 浏览 3648

长期的“台积电第一大客户”,苹果如今也不得不“抢产能”了

华尔街见闻官方 浏览 2595

小米Watch Type-C充电底座发布:磁吸设计、共用手机线,39元

IT之家 浏览 1863

专家:诺贝尔化学奖获奖项目产业化或率先在中国实现

上观新闻 浏览 16853

荣梓杉塌房太离谱!出轨家暴还反咬?

东方不败然多多 浏览 3737

这条裙子,今年悄悄火遍全网,冬天穿好有氛围

黎贝卡的异想世界 浏览 3136

独特艺术理解 宾利Batur定制车型官图发布

车质网 浏览 2592

王石离婚风波首现身?豪宅聚餐打牌

好贤观史记 浏览 2695

从夸克眼镜,到豆包手机,为什么巨头扎堆端侧AI?

华尔街见闻官方 浏览 3252

朱一龙梁家辉一出手,若不出意外,这部国产大片估计得“封神”

娱乐圈笔娱君 浏览 3036

鲁比奥称对巴拿马涉港口裁决感到振奋 外交部回应

北京日报 浏览 94430

这个冬天《鬼怪》“解冻”得有些早

时尚COSMO 浏览 3325

CBA再无全胜球队!广东31分惨败北京,最新积分榜:卫冕冠军登顶

侃球熊弟 浏览 2929

前桑德兰队友:阿马德和我在场上很默契,未来他还会更出色

懂球帝 浏览 1108

赣州队1-0宜春队,总比分3-0夺得赣超冠军,卢欣头球破门

懂球帝 浏览 2926

美国防部将提供“战斧”决定权交给总统

国际在线 浏览 3443
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1