关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2476人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

内塔尼亚胡遭遇“全球孤立” 联大发言多国代表离席

环球网资讯 浏览 4305

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者 浏览 2626

军报评何卫东、苗华等被开除党籍军籍:没有"铁帽子王"

北京日报客户端 浏览 9815

特朗普:我若遭到暗杀 美国将把伊朗“从地球上抹去”

扬子晚报 浏览 2457

从“道地药材”到“数字服务”,九州通“链”出中药增长新动能

正经社 浏览 3629

连爆2大行业瓜!大花回应只字不提影帝

大龄女一晓彤 浏览 3290

将于二季度上市 蔚来ES9实车曝光还有双色车身

网易汽车 浏览 2664

人字纹,高级又经典!

Yuki女人故事 浏览 2763

蒋欣节目中直言自己没人追,理想型竟然是他!

青史楼兰 浏览 3411

韩国U23 4-2逆转黎巴嫩U23,姜成真、金泰元建功,文承旻破门

懂球帝 浏览 2647

辽宁无缘决赛采访!杨鸣回应赵继伟伤势,再谈辽粤对决展伤感话题

篮球资讯达人 浏览 3482

秦雯自曝袭警被抓后,让王家卫捞人找自己?

芊手若 浏览 3438

林慧卿:我国第一代乒乓球削球女王,退役后如何?

阿光的技巧课堂 浏览 4078

随着广东+上海+广厦全赢球,CBA最新积分榜如下:2队全胜+2队全败

侃球熊弟 浏览 3014

韩残疾人福利院院长性虐待19名女性 受害者称其"爸爸"

扬子晚报 浏览 7164

江苏省委省政府成立调查组 对南京博物院开展全面调查

北京日报客户端 浏览 31256

米体:普利希奇将接受医疗检查,阿莱格里和米兰对美国队不满

懂球帝 浏览 3775

热议中超:恶心国安放水,西海岸和英博值得尊重

懂球帝 浏览 3675

细节调整 新款享界S9纯电版申报图曝光

车质网 浏览 3891

2165.1亿件!2025年我国邮政快递业业务规模创新高

央视财经 浏览 2575

当选对阵巴黎全场最佳,诺伊尔社媒庆祝胜利:团队

懂球帝 浏览 3465
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1