关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2688人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美国政府进入史上"停摆"最长时间 特朗普表态

红星新闻 浏览 16176

活塞99-98险胜老鹰,杜伦21分11板,杰伦-约翰逊空砍29+13

懂球帝 浏览 3127

高市在日本青年群体中获极高支持率 专家解读

北京日报 浏览 18907

日本民众举行集会 抗议高市政权扩军修宪

国际在线 浏览 210

西班牙足协主席:我们会充分照顾球员利益,俱乐部可以放心

懂球帝 浏览 3537

“装了周杰伦”的机器狗?巨星传奇把6000台卖给了谁?

野马财经 浏览 3387

萨顿:枪手踢得很不错,失利会让他们变得更加强大

懂球帝 浏览 746

卡里克向拉爵承诺带曼联重返欧战!赢曼城秘诀曝光,弗爵为之鼓掌

罗米的曼联博客 浏览 2626

特朗普对伊朗新任最高领袖感到"不高兴"

新华社客户端 浏览 1702

足球报:J联赛改为跨年赛制,将对降雪地区俱乐部补贴50亿

懂球帝 浏览 3717

全球仅2家!广东1.85万亿产业托底,杀出美股+港股双上市智驾巨头

21世纪经济报道 浏览 2587

白百何被骂翻了!聊天记录自锤耍大牌难搞?

萌神木木 浏览 3437

又一中将在俄境内被炸死 俄方或实施对等定点清除行动

新民晚报 浏览 30409

给韩国人一点小小的咖啡因震撼

Vista氢商业 浏览 1754

春天穿“黑色”太沉闷?学会这些搭配小技巧,显瘦减龄还洋气

静儿时尚达人 浏览 306

五一消费爆发,新茶饮“爆单”!霸王茶姬5天狂揽1600万人次

国际金融报 浏览 219

追寻阳光的Isabel Marant女郎,再次独自启程

时尚COSMO 浏览 3908

王勤伯:美感足球给AI足球上一课!巴黎拜仁谱传奇

体坛周报 浏览 511

假期重磅!委内瑞拉局势影响多大?AI、商业航天、智能驾驶都有大利好

看财经show 浏览 2795

七匹狼一年靠投资赚超3亿,男装不行投资来救该咋看?

江瀚视野 浏览 774

“恨海情天仙品CP”郭晓婷王天辰将合体拍杂志

手工制作阿歼 浏览 1965
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1