关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻4424人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

还能复活?某上海新势力公司宣布预重整

汽车工程师 浏览 2983

媒体:美"自由计划"1天即停 信号变得格外微妙

央视新闻客户端 浏览 14405

最高补贴1.5万元!深蓝、小米、蔚来等车企“兜底”新能源车购置税差额

红星资本局 浏览 4151

2.8亿债务逾期,良品铺子实控人收执行通知,公司去年预亏超1.2亿

红星资本局 浏览 2955

2026年春晚分会场官宣 周深肖战刘宇宁令人期待

你我话娱乐 浏览 2676

牛弹琴:欧洲终于开骂了 特朗普可能会气到咆哮

北京日报客户端 浏览 7535

离婚5年,她真的面相大变

江湖人称艾掌门 浏览 3425

媒体:中国该如何在军事部署上经营台湾 如今值得思考

新民周刊 浏览 8401

双向奔赴!澳优乳业再度携手江南大学 为营养健康行业发展注入创新动能

中国商报 浏览 4262

嫁给汪涵17年,细扒杨乐乐心酸现状,她的选择真的对吗?

不八卦会死星人 浏览 4405

商务部公告附件首次改为wps格式,金山办公的信创未来该咋看?

江瀚视野 浏览 4254

因妻子出轨 男子与堂哥合谋车祸撞死儿子骗保被判死刑

红星新闻 浏览 16981

小区多名业主凿穿楼板造出地下室 将地下车库变成私宅

潇湘晨报 浏览 20052

怕停产清单|| 用了8年的白月光竟然要涨价?100+捡漏快来

黎贝卡的异想世界 浏览 1097

给过去10年最好的谍战剧排个名:《沉默的荣耀》第6,《风筝》第2

皮皮电影 浏览 3768

79岁一代文艺女神走了:终生未婚,一辈子穿西装

世界音乐公号 浏览 4237

2025年10月我国新能源汽车销量占比超50% 历史首次!

智车情报局 浏览 4008

LLM越狱攻击威胁被系统性高估? 基于分解式评分越狱评估新范式

机器之心Pro 浏览 4443

东华测试寻求打开机器人领域新空间

爱集微 浏览 4103

以方袭击后 美副总统表态:加沙停火协议仍在维持

国际在线 浏览 4053

拥有超灵巧机械手,人形机器人North可打乒乓球、组装纸风车

IT之家 浏览 3198
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1