关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2418人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

邮报:罗塞尼尔邀请麦克法兰加入切尔西一线队教练组

懂球帝 浏览 2669

中国队手下败将逆袭进联合杯四强,袁悦45分钟速败引发网友热议

网球之家 浏览 2719

牌桌被掀,中国模型换了一种赢法

36氪 浏览 2586

复星医药14亿元押注停产药,其疗效问题饱受市场争议,公司回复监管函

红星资本局 浏览 2885

辛纳晋级中网男单八强

体坛周报 浏览 4069

严屹宽老婆41岁生日,婆婆送杜若溪万元大红包

爱八卦的晓请 浏览 2464

Windows 11长期存在0x80070103错误:微软承认无法彻底修复!

快科技 浏览 3504

刷游戏像刷视频,这个AI游戏版TikTok火了

智东西 浏览 1004

杨曙光委员:国产科学仪器“突围战”,上海如何打造“科技之眼”?

上观新闻 浏览 2460

姚期智:“AI+量子”将极大拓展人类计算能力边界

文汇报 浏览 4462

提升冬日幸福感的8件小事,放松又治愈

LinkFashion 浏览 3292

学校食堂有食物黄曲霉毒素超标11倍 学生:食堂有"毒"

每日经济新闻 浏览 6745

斯基拉:尤文、罗马、国米都在关注热那亚中场弗伦德鲁普

懂球帝 浏览 3600

在巴林的中国旅客亲历空袭:你听!导弹又来了

澎湃新闻 浏览 1899

初夏穿衣千万别发愁,看看这些日常穿搭,减龄舒适又显身材

静儿时尚达人 浏览 225

决战星期四:懂球帝6-3战胜超越足球俱乐部

懂球帝 浏览 3389

中国留学生潜水后失踪妻子4天后报警 仅找到一根胫骨

新民晚报 浏览 22760

美国进逼委内瑞拉 分析人士:已突破国际法的危险界限

上观新闻 浏览 3484

冬天别只穿厚重的羽绒服,看看这些大衣穿搭,高级大方又有质感

静儿时尚达人 浏览 2602

黄多多晒20岁生日照,美国公寓装修高档

揭秘世间万象 浏览 2365

时尚守艺人 | 这不是幻觉,麒麟真的眨了眼

时尚COSMO 浏览 3677
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1