关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2695人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

这些才是最接地气的日常穿搭!多穿衬衫、腰线明显,舒适显瘦

静儿时尚达人 浏览 311

车长超5米 比亚迪海狮08/海豹08配高阶智驾

网易汽车 浏览 2707

smart精灵#3艺术特别版上市售18.49万

网易汽车 浏览 2510

配1.5T增程/猎鹰700辅助驾驶 星途ET5预售15.99万起

网易汽车 浏览 3410

媒体:中国该如何在军事部署上经营台湾 如今值得思考

新民周刊 浏览 7904

苹果发布iPhone 17e:起售价4499元,支持实体+eSIM卡组合

澎湃新闻 浏览 1933

伊朗向美军舰发射的导弹上写了句话 特朗普再发威胁

每日经济新闻 浏览 30058

3.9秒破百/具备L3级智驾能力 奥迪E7X预售28.98万起

网易汽车 浏览 234

固态电池量产提速!超千万新能源车主,竟成被割的 “老韭菜”?

数字财经智库 浏览 4388

鸿蒙版微信一周年:从“能用”到“好用” 超2000万下载量背后的进化史

快科技 浏览 3719

车企“偷换”电池背后:产能不足还是另有隐情

经观汽车 浏览 3615

分羹法拍房!富滇银行落地首笔“法拍贷”,曝五部门全程配合

密探财经 浏览 4185

尴尬的是最后输了,狄龙回喷骂自己垃圾的热火球迷:看看比分,f**k

懂球帝 浏览 2529

穿了十年仍然心动的外套,它算一件

黎贝卡的异想世界 浏览 2783

斯基拉:尤文派出球探考察萨索洛中场伊斯梅尔-科内

懂球帝 浏览 1707

重兵集结下美伊本周再谈 特朗普面临两个选择

澎湃新闻 浏览 2082

原厂带升顶/有纯电有增程 福特智趣烈马将上市

网易汽车 浏览 3028

AI抢产能、车厂抢内存,这场博弈中国车企如何破局?

百姓评车 浏览 2442

债市,大调整!

米筐投资 浏览 3130

Aqara绿米推出U400智能锁:自带UWB超宽带,可实现无感解锁

IT之家 浏览 2811

迪丽热巴的脸,又被审判了

科学发掘 浏览 215
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1