关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者3011人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

梁小龙一生刚直!因一句“我是中国人”被逼写悔过书,他当场拒写

萌神木木 浏览 3296

韩硕辞职后首战!新疆42分狂胜送四川18连败 齐麟复出11分

醉卧浮生 浏览 3191

辽宁98-86送北控3连败,威尔斯31+7,廖三宁9中9空砍22+7

懂球帝 浏览 3539

牛弹琴:欧洲大怒 多支军队兵发格陵兰抗衡美国吞并

现代快报 浏览 3190

量子位「MEET2026智能未来大会」启动!年度榜单征集中

量子位 浏览 4296

三星One UI 8.5前瞻:基于安卓16,引入情景感知AI

IT之家 浏览 3793

连续被血洗!今年前十个月的涨幅,币圈一个月跌完了

华尔街见闻官方 浏览 3963

《唐诡3》将至,苏无名卢凌风兄弟反目,8大诡案一个比一个瘆得慌

最爱酷影视 浏览 4989

前安永合伙人,因酒吧斗殴被解雇,早前涉嫌勾引已婚女合伙人被警告

财通社 浏览 4010

咖啡万店新王诞生:挪瓦如何以“寄生模式”隐秘扩张?

虎嗅APP 浏览 3513

女子网购雅鹿羽绒服衣袖上现"孝"字标 商家:补偿10元

都市报道 浏览 5399

华为MateBook Pro电脑通过OpenHarmony 6.0 Release认证

IT之家 浏览 3099

首款星闪音频耳机!华为FreeBuds Pro 5悦彰耳机开售:1499元 母带级无损音质

快科技 浏览 3616

排队两小时买奶皮子糖葫芦,值吗?

时尚COSMO 浏览 3411

小麦身价下跌,德转:仅靠稳定发挥不足以维持高身价,且已29岁

懂球帝 浏览 3537

从“AI猪食”到“大模型旅鼠”,2025年度热词背后的新商机

吴晓波频道 浏览 3572

解锁刘浩存的「红运」密码 | 高清镜头后的底气

时尚COSMO 浏览 1107

“疲惫脸”太丑了!有这些特征的女生怎么救?

Yuki女人故事 浏览 4721

何超莲窦骁,婚变风波后首次同框

喜欢历史的阿繁 浏览 4019

冬天穿衣既要有温度又要有风度!看看这些穿搭,优雅又显瘦

静儿时尚达人 浏览 3174

美媒:特朗普敲打高市 要求日本在台海问题上降调

观察者网 浏览 30942
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1