关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3499人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普要重启核试验引巨大争议:因中国五年内可赶上

澎湃新闻 浏览 3543

内娱开年第一爆瓜:14个男顶流,被同一个"嫂子”创飞了

Yuki女人故事 浏览 2805

澳大利亚女足近3次亚洲杯半决赛保持不败,共6次参赛4次晋级

懂球帝 浏览 1670

东方甄选线下店开业:不卖菜卖简餐,全标品

商业观察家 浏览 346

香港科大:用"随机策略"训练AI数学推理,效果竟然超越复杂算法

科技行者 浏览 3613

推广|| 用完立马复购!百元get大牌肤感

黎贝卡的异想世界 浏览 2907

高市早苗当选日本首相 成为日本历史上首名女首相

环球网 浏览 8657

审美倒退30年?舒淇却被全网夸爆了

Yuki女人故事 浏览 756

内维尔:姆伯莫的射门相当离谱且草率,他需要改进临门一脚

懂球帝 浏览 3003

以高官:内塔尼亚胡判断失误 低估了袭击卡塔尔的后果

澎湃新闻 浏览 25829

她是钟小姐的穿搭榜样,从20岁到70岁,每一套都让人想copy

黎贝卡的异想世界 浏览 3586

朱媛媛遗作《小城大事》定档1月10日

阿淫记录生活日常 浏览 2635

若乌方试图袭击克宫俄方将作何反应 佩斯科夫表态

环球网资讯 浏览 4258

没补贴、收购置税,新能源车好日子到头了?现实会打服“恨电派”

小李车评李建红 浏览 4330

孙红雷夫妇现身三里屯被偶遇,穿着时尚不服老,与妻子同行显娇小

扒虾侃娱 浏览 2788

高端海鲜“老炮儿”,开始扎堆做小火锅

餐饮老板内参 浏览 2181

锦州银行落幕引发渠道整合,超1600只基金上演“代销大迁徙”

券商中国 浏览 3469

夏天的白裙,可以像赫本那样穿

Yuki女人故事 浏览 315

史上最强编程模型Claude 5泄露,最慌的是黄仁勋?

字母榜 浏览 2442

Nuralogix智能镜亮相CES,可看脸提供“长寿评分”

IT之家 浏览 2783

成本仅为真人1/18!漫威衍生剧用AI重拍女二,太厉害了吧

娱乐白名单 浏览 3798
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1