关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者3203人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

陈乔恩带老公和父母聚餐,Alan负责拍照

黄谋仕 浏览 3278

长安汽车董事长朱华荣:预计到 2030 年,L2 辅助驾驶将成为标配

IT之家 浏览 4199

缺席训练!曝25岁主力门将遭申花“三停”,上轮中超赛后通宵泡吧

我爱英超 浏览 4203

刚果(金)东北部遭武装组织袭击 至少36人死亡

国际在线 浏览 877

分子设计迎来AI新纪元:蒙特利尔大学让计算机成为"分子工程师"

科技行者 浏览 3155

辛芷蕾拿影后是 “靠运作”?央视都看不下去,为她发声真解气!

娱乐圈笔娱君 浏览 4041

拆解助贷“六小强”三季报

北京商报 浏览 3674

俄官宣“末日鱼雷”完成核动力试验

环球网资讯 浏览 4083

阿萨德垮台,谁将掌权叙利亚?

浏览 27598

当年霍震霆给儿子霍启刚挑儿媳妇,眼光多毒啊

小光侃娱乐 浏览 3731

或2027年发布 全新丰田凌放Harrier谍照曝光

车质网 浏览 3358

定位顶级奢华MPV 奔驰VLE测试谍照曝光

车质网 浏览 3423

马竞战博德闪耀大名单:格列兹曼缺阵,小蜘蛛、瑟洛特在列

懂球帝 浏览 3059

5人违规穿越鳌太线3人遇难:为规避罚款手机调飞行模式

极目新闻 浏览 8064

剑南春丨曼联1-1利兹联,阿伦森破门,齐尔克泽助攻库尼亚扳平

懂球帝 浏览 3306

新角色?詹姆斯复出后或成湖人老三 变身加强版追梦更利好紫金军

罗说NBA 浏览 4130

郭磊:如何认识最新的出口数据和出口形势

首席经济学家论坛 浏览 4346

新能源购置税“末班车”,上还是不上?

浙江车网 浏览 3946

李湘账号被封才2天,与释永信关系真相大白

陈意小可爱 浏览 3125

诋毁蚂蚁集团,粉丝超1亿“专家”被封禁,什么信号?

一见财经 浏览 1650

站在4000点的十字路口,这六位“固收+”强将值得一看

证券市场周刊 浏览 4002
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1