关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者4002人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

巴菲特被曝已清仓比亚迪,持股期间比亚迪股价涨超38倍

澎湃新闻 浏览 4821

海军四川舰顺利完成首次航行试验

央视新闻客户端 浏览 2857

牛弹琴:针对16岁以下的孩子 澳洲干了件前所未有的事

现代快报 浏览 8358

仅买10天的哈弗大狗高速上突发变速箱故障 车主后怕

大风新闻 浏览 26571

极氪启动跨代智驾众筹 24款老车主可低价直升Thor-U

网易汽车 浏览 3727

承德露露,温水煮青蛙

斑马消费 浏览 4115

状态不佳,阿森纳对阵森林上半场8脚射门0射正

懂球帝 浏览 3077

马绩效:尤文对皇马机会多但把握差,很难说这就是积极的表现

懂球帝 浏览 4139

跟着这些古早变美综艺,真的能学到东西啊

黎贝卡的异想世界 浏览 3030

翻车舞台!张远魔改《夜的第七章》,拉垮黄霄云

黔乡小姊妹 浏览 3430

王石离婚风波首现身?豪宅聚餐打牌

好贤观史记 浏览 3240

六王赛:辛纳2-0阿卡夺两连冠获600万 德约0-1后退赛无缘季军

醉卧浮生 浏览 4240

磁浮底盘/全铝车身 凯迪拉克新CT6上市28.99万起

网易汽车 浏览 4150

高芙输球后更衣室摔拍遭外界批评,萨巴一句女人比男人耐热惹争议

网球之家 浏览 3024

华为,最新发布!易烊千玺点赞!

中国基金报 浏览 3390

理想MEGA车主声明: 车辆系突发自燃并非电池包破损

网易汽车 浏览 4055

林子烨:被粉丝捧成“小张凌赫”,一场活动就塌房?

八卦三缺一 浏览 1338

双剑合璧:科创板、创业板的重大改革与长期投资价值

尺度商业 浏览 3975

永辉超市减持红旗连锁,套现上亿元

红星资本局 浏览 3027

热搜上消失的女明星,正在偷偷养鸡

Yuki女人故事 浏览 4312

空客天津第二条总装线投产,称产能提高需联合各方构建更具韧性的供应链

澎湃新闻 浏览 4262
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1