关闭广告

斯坦福大学团队推出「许可证神谕」:让AI学会说「我不知道」

科技行者3113人阅读


当你向ChatGPT询问某位哲学家的出生日期时,它总是信心满满地给出答案,哪怕这个答案完全错误。这种现象被研究者称为「幻觉」,就像AI患了妄想症,总是编造一些听起来很有道理但实际上完全错误的信息。来自加州圣迭戈RA软件公司的理查德·阿克曼和保加利亚索菲亚大学的西蒙·埃马努伊洛夫在2025年发表的这项研究,提出了一个革命性的解决方案——「许可证神谕」系统。

这项研究发表在2025年的学术期刊上,研究者通过设计一种全新的架构,让AI在回答问题前必须先检验自己的答案是否正确,就像给AI装上了一个严格的「事实核查员」。研究团队在实验中取得了惊人的成果:传统方法只能达到56.7%的准确判断率,而他们的系统达到了完美的100%准确率,完全消除了虚假答案的产生。

研究者首先深入分析了AI产生幻觉的根本原因。在他们之前发表的研究《大型语言模型是如何被设计来产生幻觉的》中,研究团队指出,这个问题并非来自训练数据不足或模型调优不当,而是源于变换器架构本身的局限性。变换器模型就像一个只会模仿的学生,它能够生成语法正确、听起来合理的句子,但缺乏验证这些句子是否符合事实的能力。研究者将这种现象比作「平面语义空间」,在这个空间中

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

当选对阵巴黎全场最佳,诺伊尔社媒庆祝胜利:团队

懂球帝 浏览 3950

普京:若乌方不愿和平解决 俄方就打到问题解决

国际在线 浏览 3335

一个模型装下整个物种树!伯克利GPN-Star斩获基因预测双料冠军

新智元 浏览 4175

郎酒9月发布的会员尊享酒,为何成懂酒人的优选?

金角财经 浏览 4205

新季各队最令人期待球员中部篇 内姆哈德追逐MIP?

体坛周报 浏览 4930

吴向东一场前所未见的白酒直播,亮出珍酒李渡的里子和面子

斑马消费 浏览 1345

多项指标将破纪录,各方期待消费热潮,中国迎接“超级黄金周”

环球网资讯 浏览 4828

中印边境士兵交换糖果 中使馆:展现双方善意

环球网资讯 浏览 4323

百亿之后,珀莱雅失速

斑马消费 浏览 4287

高市早苗4天上3次新闻联播:玩火者必自焚

看看新闻Knews 浏览 46449

注射后48小时有知觉,6人重新行走!巴西科学家破解脊髓损伤难题

DeepTech深科技 浏览 2873

斯帕莱蒂为跑轰尤文注入灵魂,奥彭达被重新“救活”

体坛周报 浏览 3506

深耕全民阅读落地,咪咕以数智服务拓宽书香边界

环球网资讯 浏览 1348

晒意大利女总理"色情照"的网站发关闭声明:很快再见

中国新闻周刊 浏览 8768

OpenAI更新ChatGPT使用政策,禁止提供专业医疗、法律和财务建议

IT之家 浏览 3928

负债35亿元!扫地机器人巨头宣布破产,被中国代工厂收购;麦当劳回应涨价,网友:谁允许了;我国首批L3级自动驾驶车型进入准入目录

雷峰网 浏览 3538

媒体:卡尼访华在即 耳边吹风"针对中国"的又来了

澎湃新闻 浏览 8108

俄罗斯终于发现 福建舰服役后做中国的朋友很有面子

现代小青青慕慕 浏览 8544

起底西贝供应商:同款冷冻西兰花和海鲈鱼还卖给了谁

界面新闻 浏览 17177

双门双座+纯电后驱 全新smart #2将于2026年发布

网易汽车 浏览 3417

多基金公司接到股债恒定ETF系统改造要求 新产品最快或于11月上报

财联社 浏览 4650
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1