关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2412人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一模特曾称爱泼斯坦派对人士"吃孩子" 之后彻底消失

潇湘晨报 浏览 9091

物理学者施郁缅怀杨振宁:将来继续在心中和他对话

澎湃新闻 浏览 3721

豪门离婚,窦骁能分到多少?

江湖人称艾掌门 浏览 3569

媒体:日本挖到"稀土"想刺探中方反应 中方回一句单句

新民周刊 浏览 4860

这样的“恶女”人设,真太爽了!

伊周潮流 浏览 3390

消失1年,王子异自称得了抑郁症

失宠的小野猪 浏览 2842

南洋理工、腾讯等机构联手突破:让AI像人一样"指点"图片中的东西

科技行者 浏览 3445

上汽通用五菱2025年累销超163.5万辆 新能源年销首超百万

网易汽车 浏览 2813

陈坤儿子的生母,早在14年前就公开了?

归史 浏览 4198

赵丽颖玩大了!《小城大事》预告信息量炸裂,不愧是争剧王的大剧

娱乐圈笔娱君 浏览 2712

斯坦福MLE-Smith:自动生成机器学习竞赛题目

科技行者 浏览 3553

距伊朗161公里 巴基斯坦想邀美国在敏感地点建港口

上观新闻 浏览 3252

明年继续“国补”但政策优化;小米副董事长拟套现不超20亿美元

21世纪经济报道 浏览 2929

媒体:南博获捐的137件书画中 《江南春》算不上顶级

红星新闻 浏览 13989

上海核药概念验证联盟成立,将加速核医学成果临床转化

上观新闻 浏览 2600

吉利大战欣旺达:江湖不是打打杀杀,是人情世故

诗与星空 浏览 2837

定位大型SUV 腾势N8L将于10月28日上市

车质网 浏览 3539

证监会“女老虎”获刑7年!丈夫空降华兴资本后被查,包凡也受牵连

财通社 浏览 239

媒体:美国中期选举后 特朗普或成"跛脚鸭"被"吊打"

新民周刊 浏览 6002

赵建:货币苏醒

首席经济学家论坛 浏览 3658

时尚守艺人 | 以木为纸,雕出万千世界

时尚COSMO 浏览 2880
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1