关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2480人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

迪马济奥:亚特兰大中卫斯卡尔维尼左腿屈肌拉伤,将缺阵3周

懂球帝 浏览 3769

37岁生日变冷清,杨颖人设崩塌后的人情冷暖

花语舞者 浏览 1922

美拉德失宠了?今年冬天最流行的3个颜色,谁穿谁好看!

LinkFashion 浏览 2891

伊朗外长:霍尔木兹海峡实际开放 仅对敌人关闭

国际在线 浏览 1658

已获海港等队邀约,茹子楠表态站好梅州这班岗:拼到最后一秒

懂球帝 浏览 3330

银价已见顶

路财主 浏览 2421

粉丝给艺人当辩护律师,还住一起了,这也行?

伊周潮流 浏览 2345

燃烧等离子体国际科学计划项目启动及研究计划发布

中安在线 浏览 3123

成败AI:谷歌市值超越苹果

北京商报 浏览 2627

遵义市市长黄伟任上被查:16岁考上大学 几天前在参会

红星新闻 浏览 5881

机器人替农民“弯腰”,AI+激光精准识别、“秒杀”杂草

上观新闻 浏览 2277

俄美领导人会晤为何被“推迟” 俄外长披露原因

每日经济新闻 浏览 3548

AWS推出AI图像编辑新突破:用说话就能精准移动图片中的物体!

科技行者 浏览 2728

豪华平权大6座SUV 风云T11预售19.99万元起

网易汽车 浏览 3831

讯飞AI“工作搭子”进化成团,明日工作方式今日已至

澎湃新闻 浏览 3456

美突袭委内瑞拉动用神秘武器:委士兵跪倒在地吐血

扬子晚报 浏览 14307

曼联压哨绝平!629天首次5场不败,8战热刺不胜,延续2魔咒

奥拜尔 浏览 3505

用这几件单品,轻松get秋日氛围!

黎贝卡的异想世界 浏览 3729

闪电快讯|2026款比亚迪宋Pro DM-i上市,纯电续航提升至220km

电厂 浏览 2754

希罗赛季首秀24+7热火险胜独行侠夺5连胜 状元14中5华盛顿27+8

醉卧浮生 浏览 3229

国企董事长打伤要债人被拘 被打男子:80万元一直不给

中国新闻周刊 浏览 7039
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1