关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2474人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

名宿:拜仁选孔帕尼,如同中了头奖

体坛周报 浏览 3544

现货金价再创历史新高,牛市还能走多远?

国是直通车 浏览 2659

贝壳豪掷23亿美元回购,董事长彭永东“花公司钱为自己股票护盘”

财经众议院 浏览 3363

上海97-77大胜浙江,李弘权18分,吴前15分,兰道夫27+5

懂球帝 浏览 3016

传祺向往S9上市,四驱+华为全家桶+宁德电池

SUV大百科 浏览 4356

这个意外走红的风格,冬天穿真的很加分!

黎贝卡的异想世界 浏览 3013

Nuance Audio创新助听眼镜中国首秀,既能看清又能听清

文汇报 浏览 2737

引援自救!内蒙古矿业富豪入局,贾国龙朋友圈托举西贝

时代财经 浏览 1720

黄一鸣“砸饭碗”起诉王思聪,硬气强调不图钱

探源历史 浏览 486

"闪赎闪卖"一座万达广场 王健林也玩起"资本游戏"?

BT财经 浏览 3032

200多斤小伙落水漂浮7小时 钱塘江大潮来临之际获救

新民晚报 浏览 3947

"烟花秀"事件后始祖鸟遇"三连挫":大中华区总经理离职

每日经济新闻 浏览 9554

张柏芝自曝被大儿子管很凶,教子有方连谢霆锋妈妈都称赞

扒虾侃娱 浏览 3644

星光730灵犀动力获中汽中心高品质混动认证等奖项

网易汽车 浏览 3462

美股科技七巨头风光不再

第一财经资讯 浏览 2018

“退一步”是骗局:她们涌入山中,把世界越走越大

她刊 浏览 1752

“纸质书+VR”开启科普新形态 《寻梦天宫:中国空间站建设纪实》在京发布

封面新闻 浏览 2823

纯电续航420km 曝大众ID.Cross无伪装谍照

车质网 浏览 3067

莱切足球:福法纳加盟,恩戈姆也即将到来

绿茵情报局 浏览 2612

272马力四驱 全新一汽奥迪Q5L高功率实车曝光

网易汽车 浏览 3714

俄朝站队怒批高市 特朗普迅速与日切割中方警告很罕见

现代小青青慕慕 浏览 47801
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1