关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者3233人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

50+女人快跳出“扮嫩”误区,学会4个技巧,就能穿出高级

静儿时尚达人 浏览 4064

纽卡赛季前三个英超客场均0-0战平,为英超历史首次出现

直播吧 浏览 4816

“魏桥系”635亿并购冲刺,张波家族能否稳居中国十大富豪?

野马财经 浏览 3296

今年秋天最流行的穿法:针织+衬衫,时髦又减龄!

LinkFashion 浏览 4552

奥特曼零食之父,要去IPO了

投资家 浏览 3941

每体:腓骨骨折的邦马蒂将接受手术,或将伤缺5个月

懂球帝 浏览 3581

OpenAI营收增长放缓,美股AI股集体跳水

第一财经资讯 浏览 1080

联想 ThinkPad P1 2026 AI 元启版 10 月 20 日首销,25999 元起

IT之家 浏览 4268

这双鞋太流行了,比芭蕾鞋更少女,比玛丽珍更优雅

LinkFashion 浏览 3352

“量子科技第一股”董事长离世余波调查:已排除是刑事案件

时代周报 浏览 3413

先L3还是直接L4?国内车企还在争论,特斯拉已经“空车”上路了

Autolab 浏览 3498

特斯拉2025年产销数据出炉:销量下滑9%,不同人群反应大不同

不看车bukanche 浏览 3322

为了万亿美元薪酬!马斯克取消FSD买断制,但不适合中国国情?

电车通 浏览 3185

王大陆离奇“闪兵”案,搞垮半壁台娱圈

仙女事件簿 浏览 3383

岚图冲刺港股0融资:车型“偏科”,年销目标前9月完成48.5%

尺度商业 浏览 4409

一架无人机保护区拍鸟群致鸟摔死 无人机被人悄悄捡走

中国新闻周刊 浏览 11000

“调改”难挽颓势,永辉超市减持红旗连锁套现8100万,去年已清仓式减持中百集团

红星资本局 浏览 4323

余承东任华为终端公司董事长,孟晚舟等卸任董事

蓝鲸新闻 浏览 2797

冬天也想穿裙子!附不同温度的穿搭公式

黎贝卡的异想世界 浏览 3855

赵文卓夫妇送女儿上学,18岁赵子仪卷出高水准

凌风的世界观 浏览 3503

女子孕检低风险却生下唐氏儿 险企拒赔:只赔"标准型"

鲁中晨报 浏览 9771
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1