关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者3494人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

涉及中国 日本高官公开道歉并撤回错误言论

环球时报国际 浏览 35663

OpenAI奥特曼:能被ChatGPT消灭的工作不是真正的工作

量子位 浏览 3687

2026春夏十大流行色

LinkFashion 浏览 2246

储朝晖:应对“入学潮”,推动教育提质增效

环球网资讯 浏览 3016

于晓光做梦没想到,李在明访华秋瓷炫竟火出圈

草莓解说体育 浏览 2585

全网爆火的“鲨鱼裤”太丑了!巨显腿粗!

Yuki女人故事 浏览 3804

为明年的 iPhone 设计的“A20”芯片价格可能会大幅上涨

威锋网 浏览 3592

蔡依林演唱会被举报"搞邪教仪式" 30米机械蛇等引争议

扬子晚报 浏览 12622

参观了设计师花7年打磨的家,太开眼了!

黎贝卡的异想世界 浏览 306

女子把100克黄金当垃圾扔了急哭 查监控发现被人捡走

黄河新闻网吕梁频道 浏览 9026

吴建豪妈妈晒与言承旭周渝民阿信合照

准备好了吗 浏览 2546

外媒:特朗普反复威胁 欧洲领导人已感到厌倦

参考消息 浏览 14458

六王赛:辛纳2-0阿卡夺两连冠获600万 德约0-1后退赛无缘季军

醉卧浮生 浏览 3732

大鹏工业:外购标准件采购占比超七成 自研的被评奖项目背后现客户

金证研 浏览 3677

借款人伪造公章贷款 煤企"缺席"审理被判背负上亿债务

澎湃新闻 浏览 30028

埃尔多安指责以色列违反加沙停火协议

新华社 浏览 3645

郑智化发声道歉!坦言自己情绪上头用词不当,两次发文惹祸上身

振华观史 浏览 3555

内娱开年第一爆瓜:14个男顶流,被同一个"嫂子”创飞了

Yuki女人故事 浏览 2802

A股利好来了!多只医药股发布消息

上观新闻 浏览 2989

“调改”难挽颓势,永辉超市减持红旗连锁套现8100万,去年已清仓式减持中百集团

红星资本局 浏览 3801

牛弹琴:战机又被照射后日本急了 有人第一个想到中国

现代快报 浏览 13086
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1