关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者2456人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普:加沙停火协议已“接近达成”

新京报 浏览 4171

王一博发声,谈暂停拍戏原因

蕾爸退休日记 浏览 2904

委内瑞拉先发制人战斗机开火 美军进退两难特朗普难办

空天力量 浏览 46684

OpenAI推出GPT-5.5 Instant:更可靠、更智能、向全体用户开放

华尔街见闻官方 浏览 319

美女克拉拉官宣离婚,6年豪门婚姻告终

代军哥哥谈娱乐 浏览 3728

一群人闯进女子刚买的新房砸了两面墙 物业称出于好心

杭州交通918 浏览 54367

谢娜演唱会庆功宴现场 张杰宠妻 半个娱乐圈齐聚

手工制作阿歼 浏览 235

2025款奔驰GLB 220典藏版上市 售价34.99万

车质网 浏览 2679

7年联姻终止!蔚来合资公司注销

敖博管理 浏览 4391

林子烨:被粉丝捧成“小张凌赫”,一场活动就塌房?

八卦三缺一 浏览 753

健康活到100岁,科学能做些什么?@U35张汉林试图寻找衰老背后的“隐藏逻辑”

上观新闻 浏览 2754

美国政府联手苹果、微软、OpenAI等公司,招募1000名工程师打造"科技力量"

华尔街见闻官方 浏览 2980

丰田"世极"正式独立 全新概念车剑指劳斯莱斯

网易汽车 浏览 3593

苹果天气App昨晚出现宕机,目前异常已修复

三言科技 浏览 546

豆包手机最高被炒至1.29万元 日租费高达1600元

极目新闻 浏览 33375

特斯拉与迪士尼合作引争议:车机引入《创:战神》车模被指广告

IT之家 浏览 3766

全是感动!《许我耀眼》33集大结局,是我今年看过最泪奔的大结局

娱乐圈笔娱君 浏览 3707

"最快女护士"张水华辞职后首战获第六名 本人赛后回应

每日经济新闻 浏览 6907

牛弹琴:欧洲终于开骂了 特朗普可能会气到咆哮

北京日报客户端 浏览 6958

骗取生育保险基金,主犯获刑十年!国家医保局曝光典型案例

环球网资讯 浏览 3768

赵丽颖直播太实诚,被问儿子暖还是羊绒暖,赵丽颖果断选择儿子

扒虾侃娱 浏览 3743
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1