关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻923人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普:俄方知道美国在俄海岸附近部署核潜艇

环球时报 浏览 792

铜价历史新高推动“复合集流体”量产提速,易开盖龙头“英联股份”能否成为跨界黑马?

时代周报 浏览 38

尴尬的红毯!倪妮撞衫 孟子义摔倒 上淇流鼻血

叶公子 浏览 13532

《庆余年2》大结局:叶流云一剑斩半楼,范闲恢复内力!

电和影 浏览 11453

7位割双眼皮的女星 大方承认口碑更好

FancyMusic 浏览 15061

棉服比羽绒服更保暖?4种顶级科技棉,始祖鸟、巴塔、军装都在用

潮人志Fashion 浏览 13515

甲骨文业绩不及预期,资本开支比预期多约150亿美元,盘后重挫超10%

华尔街见闻官方 浏览 60

男子割包皮质疑收费贵杀害医生获无期 案件细节披露

潇湘晨报 浏览 108344

赵英俊追悼会在京举办薛之谦、包贝尔、黄渤等明星好友现身

趣看热点 浏览 26226

香港“抢人”!内地9所大学毕业生可落户,放宽条件引进高端人才,7周内超万人申请

证券时报e公司 浏览 19493

刚刚!利好突袭,直线爆拉!

中国基金报 浏览 761

央行重磅会议释放新信号!下半年行情开门红可期?

每日经济新闻 浏览 15643

能否复刻N7的成功?日产N6申报图现身

Nice好车 浏览 980

国盛投资受让1.07亿股股权 复旦微电大股东拟变更

证券时报 浏览 525

不想过年的年轻人,躲回工作中

刺猬公社 浏览 12159

茅台提价20%明年或增厚利润50亿 券商分析师:想尖叫

时代周报 浏览 80365

AI如何助力空调“降温”过程中更节能,珠海这场论坛揭秘

南方都市报 浏览 936

她宣布离婚,是果然被李靓蕾锤中了吗?

伊姐看电影 浏览 12838

西安地铁8号线已发现古墓1356座,春节期间出土各类文物140余件

趣看热点 浏览 26118

女主播被伪装的炸弹包裹炸伤:拿起看了一眼就爆炸了

极目新闻 浏览 5337

男子在愚人节开玩笑写敲诈信被法院判决敲诈勒索罪,愚人节开玩笑也要适度

趣看热点 浏览 1111400
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1