关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者2473人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

绝望的日本车:搞新能源押错了宝,随时有可能被国产车一波推

小李车评李建红 浏览 2950

西媒:巴萨系俱乐部在仓库存了30万件球衣,共花费400万欧元

懂球帝 浏览 2458

周星驰悼梁小龙,翻起港圈大佬们的恨海情天

仙女事件簿 浏览 2511

女生显土的4种穿搭,真的不好看!

Yuki女人故事 浏览 3659

网友600多买天津飞北京机票 中转成都30多个小时游玩

极目新闻 浏览 13661

牛弹琴:战机又被照射后日本急了 有人第一个想到中国

现代快报 浏览 13082

不是第一次了,穆斯卡特两年前曾率队在天皇杯输给町田泽维亚

懂球帝 浏览 3606

保时捷失守中国市场

第一财经资讯 浏览 2912

谷歌Pixel 11系列手机Tensor G6芯片爆料:7核CPU

IT之家 浏览 516

IPO观察丨东鹏饮料再递表港交所,大单品收入占比近8成,上半年广告费超8.8亿元

红星资本局 浏览 3878

追觅超跑亮相CES 1903马力 零百加速仅需1.8秒

网易汽车 浏览 2726

申花2-0首尔获亚冠首胜!终结对韩国球队4场不胜 阿苏埃破僵+伤退

我爱英超 浏览 3754

绿地张玉良,失去一员“大将”

红星资本局 浏览 4303

马绩效:尤文对皇马机会多但把握差,很难说这就是积极的表现

懂球帝 浏览 3647

福建舰全体官兵列阵 送上硬核祝福

央视军事 浏览 2000

推广|| 被低估的百元级国货!推荐你们趁好价试试

黎贝卡的异想世界 浏览 5538

“不死鸟”上新!丰田Hilux完成换代,造型更硬核,启用纯电动力

闻车品百魅 浏览 2098

刘维伟回国寄语杨瀚森:未来不会顺利每天都要进步 获赠签名球衣

醉卧浮生 浏览 3604

卡什:阿卡辛纳这样“双马竞争”对网坛来说不是健康的事

网球之家 浏览 2738

墨西哥总统:骚乱平息 瓜达拉哈拉机场遭占领消息不实

都市快报橙柿互动 浏览 38715

媒体:美国对台军售 本质是在加重中华人民共和国负担

新民周刊 浏览 8563
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1