关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻928人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普突然中止与加拿大贸易谈判 加元汇率直线跳水

每日经济新闻 浏览 6818

俄乌冲突近一周年 两国都宣称去年的经济数字比预期好

枢密院十号 浏览 92617

切尔西vs多特蒙德前瞻:切尔西渴望主场复仇

直播吧 浏览 19878

美防长奥斯汀1月1日被送医治疗 目前身体在康复中

环球网 浏览 12749

皮尔斯:如果我和詹姆斯年纪相同,他绝对不可能拿到4座冠军

懂球帝 浏览 941

17年的双十一底层逻辑变了?“小时达”来了,AI帮你选品

时代周报 浏览 619

1家5口从三亚飞回新疆要花10万 网友帮忙想出省钱方案

大象新闻 浏览 81748

40℃高温让空调卖爆了,经销商也无奈:安装工人紧缺,下单要等四五天

时代财经 浏览 15543

西方媒体称卢卡申科访华为疏远俄罗斯 向中国求助

新民晚报 浏览 19523

《沙丘2》中有一处令人费解的漏洞

幕味儿 浏览 12029

人间最美四月天 换鞋计划赶紧安排上

YOKA网 浏览 19445

蔚来推新ES6 30万台纪念版,整车售价34.98万元

财闻 浏览 524

发生了什么?A股瓜子巨头净利骤降

中国基金报 浏览 14584

火箭将退役哈登13号球衣,费尔蒂塔表示他永远是一个火箭人

趣看热点 浏览 25639

托蒂:还没和斯帕莱蒂谈过去的事情,经过这么多年该放下了

懂球帝 浏览 728

反击美国"变脸"普京即将公布神秘新武器 专家分析

环球网资讯 浏览 993

反卷与新秩:中国厨电已走向未来

市值Observation 浏览 14328

超级转型,大洛佩斯生涯前8年仅进3记三分,后9年命中1072记三分

懂球帝 浏览 1004

日本半导体巨头选择“两条腿走路”

环球时报国际 浏览 12777

建议多穿衬衫和白色长裤 清爽减龄显气质

Yuki时尚酱 浏览 15979

官方:勇士正式签下塞斯-库里,后者将身披31号球衣

懂球帝 浏览 234
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1