关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2475人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

假期4大变量共振 哪些是A股正向催化剂?

财联社 浏览 2066

马斯克摊上事了,旗下公司被多国调查封禁

21世纪经济报道 浏览 2750

出道十年,宋威龙终于有了花香

时尚COSMO 浏览 2186

理财的,注意这两个风险!

米筐投资 浏览 2924

乌官员:袭击乌方设施的俄"榛树"导弹未携带弹头

环球网资讯 浏览 2600

戚薇李承铉能消停点不?为圈钱上800个综艺,夫妻那点破事看腻了

娱乐圈笔娱君 浏览 3640

珍珠专场|| 无论20+还是60+,一定都会对它心动!

黎贝卡的异想世界 浏览 5821

中秋节快乐!

黎贝卡的异想世界 浏览 3108

加密货币跌势连绵,近10亿美元杠杆仓被平,现货比特币ETF上周仅小幅净流入

华尔街见闻官方 浏览 3047

今日热点:金鸡奖提名发布会;霉霉不出演超级碗中场秀的原因……

伊周潮流 浏览 4366

青创人才说 | 柒色莲生物汪会兵:当好iPSC细胞疗域“铺路人”

上观新闻 浏览 3228

从 “扛周期” 到 “稳经营”:生猪期货如何破解产业困局

澎湃新闻 浏览 2685

广西百色多个村屯被洪水浸泡逾20日 多个村屯成孤岛

南方都市报 浏览 8657

芯片圈“大佬”IPO梦碎,牵出千万受贿案!

野马财经 浏览 3729

英国以“最高优先级”正式调查社交平台X

新华社 浏览 2708

WCBA全明星正赛投票结果&首发球员名单出炉,杨力维当选票王

懂球帝 浏览 1685

全新外观、新增大电池版本,新款比亚迪海狮05DM申报

IT之家 浏览 2702

年代犯罪剧又出王炸!才播3集热度第一,张家辉演技惊艳四座

娱乐圈笔娱君 浏览 4291

男子驾车撞死一家三口获死缓 被害人家属递交抗诉申请

看看新闻Knews 浏览 8155

海南自贸港全岛封关运作将启动!商务部:将以此为契机,大力推进制度型开放

红星资本局 浏览 3078

媒体:路透社"爆料"中国建造出极紫外光刻机 充满焦虑

环球网资讯 浏览 13473
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1