关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2957人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

加码中国“确定性”

国际金融报 浏览 4369

巴平民被枪杀 特朗普扬言“冲进加沙铲除哈马斯”

参考消息 浏览 10364

女子产后抑郁自缢骨灰被丈夫私自下葬 父母苦寻四年

新民晚报 浏览 8455

79岁一代文艺女神走了:终生未婚,一辈子穿西装

世界音乐公号 浏览 4237

泰柬在13条战线上交战 泰总理:愿意接听特朗普电话

环球网资讯 浏览 3579

又离了!李亚鹏得名“八离世家”

Yuki女人故事 浏览 4220

新版《聊斋》杀青,六个单元主演全亮相,林允、宋祖儿倾力加盟

最爱酷影视 浏览 4995

朱孝天方回应被踢出F4,刚合体时就挺不合群,如今开公司当老板

萌神木木 浏览 3985

首次宣布有英国军人在乌克兰身亡 斯塔默发声

环球网资讯 浏览 3524

奇瑞全尺寸SUV内饰曝光 或将搭载混合动力

车质网 浏览 237

让“死嘴”会说多说,不太好听又如何

时尚COSMO 浏览 3946

有品味的中年阿姨,穿衣搭配都有4个共同点,学会了优雅到老

静儿时尚达人 浏览 4047

报道称明年AI芯片产量拟提高两倍,寒武纪尾盘拉升,深夜“严正声明”:不实

华尔街见闻官方 浏览 3691

双11链接合集 || 一键查缺补漏,这些宝藏别错过!

黎贝卡的异想世界 浏览 4115

002931,董事会提前换届! “人形机器人第一股”实控人进驻

证券时报e公司 浏览 231

纯电汉兰达?丰田发布新款SUV预告,向新时代低头?

正在说车 浏览 3058

特朗普亚洲行美方称中美领导人将会面 中方尚未官宣

上观新闻 浏览 9138

周定洋社媒庆祝绝平申花:让我们继续拼、继续冲,一场一场来!

直播吧 浏览 5038

朱一龙梁家辉一出手,若不出意外,这部国产大片估计得“封神”

娱乐圈笔娱君 浏览 3547

海南“半价豪车”真相:代购违规,15年强制报废还得补缴巨款

国际金融报 浏览 3405

詹姆斯正建造两栋豪宅!11000平米一分为二:为布朗尼准备婚房?

罗说NBA 浏览 3375
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1