关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3901人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

保时捷的2025:利润触底+渠道震荡,百年积淀如何穿越周期?

买车君 浏览 2649

本田东京车展亮相0系列电动概念车 揭示未来出行

网易汽车 浏览 3532

网友曝姚晨新欢是侯雯元!二人交集被扒

萌神木木 浏览 1655

搭载闪充技术 比亚迪2026款海狮06EV售价15.99万元起

网易汽车 浏览 1725

NBA碎碎念合集(2)

静易墨 浏览 3586

普京签署法律修订兵役法:征兵工作将全年不间断进行

界面新闻 浏览 8119

晕了晕了!机构大动作调仓,55只行业主题ETF被疯狂扫货,而热门的半导体竟被悄然抛售

每经牛眼 浏览 3366

马斯克宣布脑机接口将量产,特斯拉自动驾驶挑战引发安全质疑

红星新闻 浏览 2891

“耳环风波”半年后 18岁黄杨钿甜首次发文

现代快报 浏览 8027

Fermín Soneira接棒兰博基尼CTO 7月1日正式上任

网易汽车 浏览 213

4680电池的大饼,马斯克不想画了

远川科技评论 浏览 2606

宗馥莉第二次辞职 娃哈哈集团已经被外界视为"空壳"

中国新闻周刊 浏览 3847

周末超重磅!特朗普关税突发,ETF净流出近2000亿,央广网:降温不是熄火

看财经show 浏览 2545

一字跌停!航天大牛股收购凉了,总经理已高位套现770万

深蓝财经 浏览 2531

骗取生育保险基金,主犯获刑十年!国家医保局曝光典型案例

环球网资讯 浏览 3763

委内瑞拉向中俄伊寻求导弹 外交部回应

澎湃新闻 浏览 3458

李亚鹏确认,靠卖北京房子和直播卖茶具,5000万债务已还清!

荆楚寰宇文枢 浏览 2770

月销破7万台!汽车圈外行朱江明,成新势力大赢家

象视汽车 浏览 3354

东南大学突破:AI学会情境化拒绝能力

科技行者 浏览 3708

时尚守艺人 | 这不是幻觉,麒麟真的眨了眼

时尚COSMO 浏览 3672

700万辆之后 中国汽车出口的“下一程”

车质网 浏览 2653
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1