关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者2687人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

日企天空推出UMPC新品TENKU Pocket 8,搭载N305处理器

IT之家 浏览 2124

许家印出事前,只有他提前果断脱离恒大,至今毫发无损

壹只灰鸽子 浏览 3586

《阿凡达3》一言难尽,好看不好吃,顶级特效盖不住影迷吐槽剧情

最爱酷影视 浏览 2955

霸榜热搜,尺度惊人,他绝对值得你追

Yuki女人故事 浏览 2374

国债被"抛售"债市遭暴击 日本或在未来面临金融风暴

红星新闻 浏览 35372

470场,格列兹曼追平科利亚尔并列马竞队史出场榜第5名

懂球帝 浏览 2980

中国美女网红流落柬埔寨街头 知情人:国内盘总的女人

社会酱 浏览 6333

优质IPO企业站上资本C位

北京商报 浏览 3006

甲骨文盘中涨超6%,华尔街"抄底派"料股价有望反弹90%

华尔街见闻官方 浏览 3232

与宾利添越是"亲兄弟" 大众途锐3.0TSI锐臻版上市

隔壁说车老王 浏览 2529

面相变了!看活动上“挂脸”的杨幂,才懂林永健对她的评价

娱乐圈笔娱君 浏览 3629

AI“一路狂飙”,南京如何用产业攻坚书写答案?

现代快报 浏览 2909

声音更加动听 本田全新一代混合动力系统最新消息曝光

乐选爱车 浏览 2691

舒淇最爱穿的裙子搭配,真的很适合春天!

黎贝卡的异想世界 浏览 1899

从“元宝”到“龙虾”,腾讯能否在AI领域复制微信的生态神话?

征探财经 浏览 1801

女子应聘疑遭老板性暗示 涉事企业法人:出于工作需要

极目新闻 浏览 8851

大衣,白色的更优雅不凡!

Yuki女人故事 浏览 2338

商汤绝影发布可悠,把“龙虾”揣兜里随身携带?

南方都市报 浏览 1038

特朗普:战事不是挡箭牌 乌克兰该选举了

澎湃新闻 浏览 2192

事关乌克兰 美英法德四国领导人通话

每日经济新闻 浏览 7334

雪落航天城!航天员呵护航天娃,航天人守护航天城

我们的太空 浏览 2582
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1