关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12387人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

匈牙利高官:北约和欧盟国家已事实上参与俄乌冲突

环球网资讯 浏览 18929

车臣军官称曾距"瓦格纳"部队数百米:准备面对各种结果

环球网资讯 浏览 88103

中国男篮已抵达深圳 王哲林的脚伤已有所好转

直播吧 浏览 14779

拉什福德社媒鼓励球队:这是马拉松不是短跑,我们会继续战斗

懂球帝 浏览 759

普通人冬天就该这么穿,衣服不昂贵、搭配不老气,简单又日常

静儿时尚达人 浏览 227

某券商首席炒黄金期货大赚14亿?本人报警了

财通社 浏览 748

22个州经济正在萎缩,消费者信心持续下跌,多家机构警告美国经济衰退

环球网资讯 浏览 988

泡泡玛特股价连跌6天

YOUNG财经 浏览 752

外星人是假的?可它真能挣钱啊!

酷玩实验室 浏览 12533

英伟达“跌倒”,寒武纪“吃饱”?

经济观察报 浏览 956

辉瑞将对孕妇展开新冠疫苗试验到底是怎么回事?

趣看热点 浏览 25280

亚足联官方:女足奥预赛中国队先客后主 4月8日开战

网易体育 浏览 25799

擅自使用军机形象进行宣传 理想汽车回应

澎湃新闻 浏览 1521

亚马逊大裁员后又暂停第二总部建设,降本增效这么艰难?

第一财经资讯 浏览 18971

科学家重构常见抗癌药物:使其疗效提升两万倍,同时副作用更低

IT之家 浏览 741

还记得《老友记》吗?除了钱德勒他们都过得如何?

橘子娱乐 浏览 14140

炸了!古二再曝录音,王家卫称游本昌不是省油灯,还说唐嫣很装

娱乐圈笔娱君 浏览 728

离婚4年,42岁佟丽娅高调官宣喜讯

刘森森 浏览 723

伊拉克安全专家:美军空袭公然践踏伊拉克主权

国际在线 浏览 12408

大巴黎公布24/25赛季财报:营收达8.37亿欧元,创历史新高

懂球帝 浏览 783

“我们已无路可退”,AI架构师被评为《时代》杂志年度人物

观察者网 浏览 27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1