关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者2968人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

引援自救!内蒙古矿业富豪入局,贾国龙朋友圈托举西贝

时代财经 浏览 2254

2026款海狮06EV开启交付 成为全国首批上市闪充纯电车型

太平洋汽车 浏览 2227

“四十不惑”的吉利 信力不信命

网易汽车 浏览 2972

强抓马杜罗后 特朗普:"门罗主义"该改为"唐罗主义"了

环球时报国际 浏览 10629

英媒:意甲俱乐部在关注拉斯金,热刺和狼队也对其感兴趣

懂球帝 浏览 3810

美团、京东外卖、淘宝闪购:自愿执行《外卖平台服务管理基本要求》国家标准

澎湃新闻 浏览 3735

特朗普政府8日召集美石油巨头 "推销"委石油投资计划

澎湃新闻 浏览 9252

高市早苗成功"策反"对手 分析称其当选首相几乎成定局

红星新闻 浏览 7962

400余场特色促消费活动来袭,2026重庆618电商嘉年华启幕

上游新闻 浏览 937

乌武装部队总参谋部通报:乌俄一天交战近250次

环球网资讯 浏览 3973

郑晓龙监制!杨紫主演耗资3.5亿的史诗级传奇剧

娱乐圈笔娱君 浏览 2377

塔帅:庆祝警察?我尊重每一种观点,并把它们放在该在的地方

懂球帝 浏览 859

陪爱妻方媛奔丧才几天,郭富城竟再迎一大噩耗

汉字笔迹心理分析 浏览 244

44岁TVB男星再当爸,港姐太太二胎诞下小儿子

TVB剧评社 浏览 3758

美可能供乌战斧导弹 俄方:或成俄乌局势重大升级节点

财联社 浏览 4311

券商三季度660亿持仓出炉!香农芯创等35股持股市值超3亿元!

私募排排网 浏览 4105

今年秋天最流行的穿法:针织+衬衫,时髦又减龄!

LinkFashion 浏览 4548

斥资5.6亿,看完《惊蛰无声》预告片,我想说:张艺谋又赌赢了!

娱乐圈笔娱君 浏览 3070

中网女单第三轮利斯挑落莱巴金娜

体坛周报 浏览 4826

今年秋冬最时髦的穿法:外套+连帽卫衣,减龄又松弛!

LinkFashion 浏览 3309

伊姐周六热推:电视剧《亦舞之城》;电视剧《时差一万公里》......

伊周潮流 浏览 3619
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1