关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者770人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中国博主称涂鸦日本靖国神社石柱 外交部回应

澎湃新闻 浏览 67842

郑爽张恒借贷纠纷案二审开庭郑爽张恒目前最新情况

趣看热点 浏览 26609

命运多舛的英伦跑车:解读Marcos Mantis历史

老爷车 浏览 187

油炸知了成网红美食:千人上山抓蝉 金蝉价格10年涨5倍

红星新闻 浏览 86839

美国国务院批准售台三项武器,总价值超18亿美元

趣看热点 浏览 25721

吊打内娱的阴湿女王,回来了

独立鱼 浏览 862

“尔滨”火爆出圈,冰雪热能撬动东北经济吗?

第一财经资讯 浏览 12954

中年女人早春更偏爱“知性风”穿搭!学会这些技巧,简单高级

静儿时尚达人 浏览 12934

别让丑内搭毁掉你的穿搭!这4款直接封神!

Yuki女人故事 浏览 72

真正的三分大赛?全明星赛两队投进67记三分 利拉德&哈利合计21记

直播吧 浏览 12420

币圈再度血流成河!比特币6月以来首次跌破10万大关,以太币暴跌10%

华尔街见闻官方 浏览 675

国际油价攀高 国内成品油零售价将迎今年来最大涨幅

澎湃新闻 浏览 110910

广汽集团:9月份销量173176辆,同比下降 5.17%!

车秀小咖 浏览 1011

王一博被批丧失事业心,引发粉丝退圈

孟一宜 浏览 812

坦克400 Hi4-T首次OTA升级:优化车机统等8项功能

汽车安利会 浏览 12887

秋天怎么穿出时尚感?适当露肤、不死板老气,高级又有回头率

静儿时尚达人 浏览 534

俄罗斯一军火库发生爆炸,爆炸碎片最远可波及20公里内区域

趣看热点 浏览 26002

曝曼联与沙特谈B费转会价格!B费想自己主宰未来,拜仁或加入争夺

罗米的曼联博客 浏览 1000

遭美政府和科技企业联合施压 欧盟扛不住了又打算屈服

澎湃新闻 浏览 4723

奇瑞高新华:让“中国智能”成为全球代名词

网易汽车 浏览 73

全智贤与《暴风圈》剧方仍未发文道歉

韩小娱 浏览 1586
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1