关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻3903人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

德外长:德国不会参与在霍尔木兹海峡的护航行动

国际在线 浏览 1636

向科米索的最后告别:富纳罗、费拉利、普拉德等人将在美国出席

绿茵情报局 浏览 2653

2.9T V6插混 全新一代奥迪RS 6谍照曝光

车质网 浏览 4228

徐正源:无法以全主力出战,又存在伤病,输球很遗憾

懂球帝 浏览 3770

深圳00后600多万在港抄底买房 内地客十年砸下8000亿

南方都市报 浏览 16016

阿维塔求变:抱紧华为、告别个性走向大众

经济观察报 浏览 3180

多家银行关停旗下App,银行App关闭潮意味着什么?

江瀚视野 浏览 3868

西媒:迈阿密国际有意洛塞尔索,已向其表达强烈兴趣

懂球帝 浏览 2975

Meta裁员后续:田渊栋被过河拆桥,姚顺雨等集体「抢人」

机器之心Pro 浏览 3549

千岸科技合规与税务双承压:股东借离婚还原股权代持,海外累计被罚近百万元|读懂IPO

时代周报 浏览 1034

最新“施工图”预示,真正的风口藏在这5个“强国”中

BT财经 浏览 1789

女子手机突然预警陌生人在家偷东西 男子看见监控懵了

环球网资讯 浏览 6716

阿富汗称与巴基斯坦在伊斯坦布尔举行第三轮谈判

国际在线 浏览 3386

白俄罗斯国防部长:边境出现“前所未有”军事集结

环球网资讯 浏览 2655

泽连斯基:乌克兰计划2027年加入欧盟

财联社 浏览 6289

价格倒挂加剧,经销商危机恐反噬整车厂

汽车人传媒 浏览 4402

萨顿力挺凯恩:英格兰从未有过几个比他更好的球员

懂球帝 浏览 3757

曝窦骁婚变原因!何超莲曾怀孕又流产,相关照片被扒女方变化明显

萌神木木 浏览 3686

韩安冉回应五婚,称暂时不会结烦了,与宋浩然离婚后仍每天见面

扒虾侃娱 浏览 3666

上市近30年终落幕,天茂集团主动退市

虎投邦 浏览 3832

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻 浏览 3904
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1