关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2685人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

汽车图谱⑳|新能源车迎最强“金九” 新势力头部月销达4万量级

贝壳财经 浏览 3765

腾讯元宝宣布“任务”功能上线:一句话安排时间,到点就提醒

IT之家 浏览 2882

女演员自曝曾遭受校园暴力!留下心理阴影

鲁中晨报 浏览 2193

卡拉格:曼城表现得很好,阿森纳会在英超冠军争夺中感到紧张

懂球帝 浏览 3333

“肉测”成都自动驾驶公交:提前免费预约,一人一座,一趟车有14个名额

红星新闻 浏览 2726

永辉超市减持红旗连锁,套现上亿元

红星资本局 浏览 2493

小米SU7 Ultra飞坡翻滚多圈 车主:感谢雷军

扬子晚报 浏览 3046

日本年度第一!文艺影迷必刷的蓝色之诗

幕味儿 浏览 3503

没想到这3个小习惯,给我生活带来这么大的变化

黎贝卡的异想世界 浏览 3779

世体:拉波尔塔周一中午抵达体育城,向球队重申支持和鼓励

懂球帝 浏览 3586

雷军被人堵在车里维权?小米高管回应

电动知家 浏览 771

邵佳一:退役画面还在脑海;做教练最适合我,离不开这个地方

懂球帝 浏览 2653

北约秘书长斩钉截铁:欧洲永远离不开美国

扬子晚报 浏览 22856

轴距进行加长 奥迪A7L旅行版国内谍照曝光

车质网 浏览 2482

美媒:中美之间一个变化正在显现 欧盟总部相当纠结

环球时报国际 浏览 13056

芯天下弃A转港,2025年前三季度业绩扭亏,毛利率回升至18%|港E声

时代周报 浏览 2688

郑丽文喊出新口号 提醒2300万岛民:赖清德想跑就能跑

博览历史 浏览 16315

纯电续航210km 海豹05DM-i/海豹06DM-i超享版加推新车型

网易汽车 浏览 2646

扫码即飞!西安街头现身共享无人机

环球网资讯 浏览 3471

国米本赛季11粒进球中4粒来自角球,身高超1.88米的球员有10位

直播吧 浏览 4409

最近很火的5条裤子,腿粗、腿不直女孩一定要试试!

Yuki女人故事 浏览 5838
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1