关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3908人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

14岁少年强奸杀害女同学被判无期 奶奶受刺激闭门不出

潇湘晨报 浏览 30461

司晓迪控诉李云迪!趁自己睡着干龌龊事还拉黑她,喊话男方别惹她

萌神木木 浏览 2836

新年将至 普京问候前线俄军:感谢英勇的所有人

看看新闻Knews 浏览 2822

今年冬天最流行的4双鞋,配阔腿裤时髦又高级!

LinkFashion 浏览 2429

乌克兰空军:一架苏-27战机在该国东部坠毁 飞行员死亡

环球网资讯 浏览 2966

看玄彬孙艺珍这样撒糖,谁能扛得住

Yuki女人故事 浏览 3196

雅图高新被举报后发长文反驳:谁是谁非需捋清 北交所非“垃圾箱”IPO企业非出气筒

财经下午茶 浏览 3591

弗莱彻首战曼联将用四后卫,B费请缨出战!新帝星已撤回转会申请

罗米的曼联博客 浏览 2711

工信部下达“强制瘦身令”:不达标的新能源车,禁止“出道”

DearAuto 浏览 2585

北京农商银行新掌门人落定,新帅首次亮相

湘财Plus 浏览 2349

华为跟广汽搞了个启境,它跟界字辈有啥区别?

差评XPIN 浏览 3831

推15款新车,鸿蒙智行的野心,是2026年正式超过奔驰?

路咖汽车 浏览 3110

梅州1-4云南,佩德罗-恩里克双响,迪力穆拉提任意球建功

懂球帝 浏览 3643

中国游客到迪拜参加婚礼被困:目睹导弹从上空飞过

极目新闻 浏览 1958

你看到的不是奔驰纯电CLA,而是汽车的下一个20年

1号车盟 浏览 3250

小米SU7 Ultra飞坡翻滚多圈 车主:感谢雷军

扬子晚报 浏览 3056

随着北京险胜,辽宁大胜,CBA最新积分榜:前四皆9胜2负 排名有变

侃球熊弟 浏览 2732

女子豪掷30万买200多箱白酒 丈夫4000元住院费拿不出

扬子晚报 浏览 17781

变阵冲决赛!U23国足VS越南首发:狂换6人 向余望先发王钰栋替补

我爱英超 浏览 2683

李昀锐孟子义被曝恋情,双方火速回应

萌神木木 浏览 3824

巴基斯坦俾路支省反恐行动打死145名恐怖分子

上观新闻 浏览 2461
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1