关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者2645人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

瑞典拉普兰:凛冽北境的万物平衡之道

时尚COSMO 浏览 2876

华为坤灵中国行首站落地上海,助力中小企业智能化跃升

上观新闻 浏览 2893

徒步甘孜失温女生不排除植物人风险:刚刚从卫校毕业

鲁中晨报 浏览 3755

章泽天这次翻车,真的不冤

独立鱼 浏览 2623

大型文化纪实纪录片《因为长江》定档10月27日

安徽博物院 浏览 3739

售19.98万元起 方程豹钛7 EV闪充版上市

网易汽车 浏览 337

汪峰演唱会遭遇“掉链子”

一娱三分地 浏览 3482

U23国足防线多人有伤在身,后卫鲍世蒙开场不久伤退

懂球帝 浏览 2639

18亿大并购,光模块独角兽,打响量产第一枪!

飞鲸投研 浏览 1021

王嘉尔东京开唱,日本名流圈组团来“团建”?

情感大头说说 浏览 3501

5万美元筛选「超级婴儿」, 智商提升15点?马斯克被曝是客户!

新智元 浏览 3654

这一次,抖音美妆让36万用户来定义美

时尚COSMO 浏览 2164

医托"忽悠"病患去中医馆:大师退休前挂号费600 现在50

极目新闻 浏览 15511

张雨绮,不能「装死」了

独立鱼 浏览 2450

消息称vivo叫停AI眼镜项目,此前已秘密筹备半年时间

IT之家 浏览 2555

快手UniMixer:推荐系统实现三合一规模化智能优化能力突破

科技行者 浏览 1120

西部联体育主管被指控未经许可挪用好友资金,给俱乐部修球场

懂球帝 浏览 3618

吴佩慈68岁"婆婆"在美国被捕 儿子靠做"叠码仔"起家

上游新闻 浏览 13445

车展前的狂欢:4天30场发布会,谁在抢跑谁在焦虑?

车市红点 浏览 747

极速养成“四力” 我在长春航展“追”飞机丨去现场做原创

封面新闻 浏览 3436

"商务部公告附件首次改为wps格式"不实 至少5年前已用

极目新闻 浏览 7957
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1