关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2463人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

52岁影后自曝交往小20岁男友,二人曾被偶遇逛街

娱乐看阿敞 浏览 3762

美国的联邦制,很落后!

浏览 26895

鸿蒙智行L3,从架构革命到出行方式重构

汽车公社 浏览 2956

美驱逐舰拦截一艘驶往伊朗港口油轮

财联社 浏览 510

又一国产车企官宣:正式全面停产、停售燃油车!

电动知家 浏览 2798

德云社郭德纲发文喜提4个新身份,含金量都不低

素衣读史 浏览 3511

"富豪"承诺月嫂月薪1万5却1年只发5500 还向她借85万

极目新闻 浏览 6121

记者:米兰正在和布莱顿谈判,尝试纯租借引进科波拉

懂球帝 浏览 2649

50+女人听我一句劝,别穿大红大紫和超短裙,才能优雅到老

静儿时尚达人 浏览 3607

安踏投资加速,主品牌却有些掉队了

36氪财经 浏览 2599

异军突起!周四与特朗普会面顺利,贝莱德的里德尔竞选美联储主席呼声渐起

华尔街见闻官方 浏览 2603

傍上 “新中式”,现制酸奶能迎来 “二次爆发” 吗?

餐饮老板内参 浏览 3073

真爱大牌 || 这些被抢空的好物又回来了,这次破价100+

黎贝卡的异想世界 浏览 3129

安德鲁被英王室扫地出门:曾3次强迫17岁女孩发生关系

新民晚报 浏览 9478

怒放竞技场3V3街头足球赛玉溪站落幕,奥斯卡、约尼查助阵

懂球帝 浏览 3533

官方:阿根廷U20主力中卫皮耶拉尼左膝扭伤;据悉无法出战半决赛

懂球帝 浏览 3768

华语乐坛,困在怀旧里

虎嗅APP 浏览 2960

刚说完"很快结束" 特朗普改口:美国要赢得"终极胜利"

参考消息 浏览 29935

U23亚洲杯8强出炉 1/4决赛对阵:国足第2出线战上届亚军 避开日韩

我爱英超 浏览 2688

纳帅:尊重马扎加入阿尔及利亚,但选择国家队应出于自豪感

懂球帝 浏览 3443

媒体:自家老牌车企落后中美 欧盟恐对中国车厂下手

澎湃新闻 浏览 10719
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1