关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2657人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

尚界H5 到店 别盯着价格,看看优缺点有哪些!

Nice好车 浏览 4417

"杭州湾X5"来了 40万级性能插混极氪8X官宣

网易汽车 浏览 2734

北约秘书长吕特与泽连斯基通话 讨论对乌军援

极目新闻 浏览 4353

文章近况曝光,当初毁掉他的从不是姚笛和马伊琍

往史过眼云烟 浏览 1103

邻居在家门口干了匪夷所思的事 杭州女子:提心吊胆

极目新闻 浏览 33406

利润暴跌99%,保时捷赚不到钱了?

汽车公社 浏览 2910

40岁童瑶与42岁蒋欣:气质对比很明显

大眼妹妹 浏览 3530

真情侣就是好嗑,短剧界有多少“因戏生情”的cp?

仙女事件簿 浏览 3624

终于来了!山东签约新大外弥补内线隐患,但陈培东感冒将缺席一场

篮球资讯达人 浏览 2673

营收翻倍+亏损收窄!广东导远自研智驾定位系统,能否凭硬核技术闯关港股?|港E声

时代周报 浏览 2700

英伟达正式发布LPU,CPU重磅更新:GPU不再是GTC唯一主角

半导体行业观察 浏览 1659

德转:24岁马里中场孔特加盟北京国安,球员身价55万欧

懂球帝 浏览 2051

2天票房3亿,看完《疯狂动物城2》,我想说:好莱坞大片赌对了

娱乐圈笔娱君 浏览 3199

数十农民工被拖欠百万工钱 劳务公司:争取春节前兑付

大风新闻 浏览 5629

中秋看热巴的嫦娥装,又双叒叕被撩到了

时尚COSMO 浏览 3038

尼日利亚主帅:民主刚果在点球大战时使用巫师做法,胜之不武

懂球帝 浏览 3360

埃尔多安专机在空中一直盘旋 确认以总理不参会才降落

红星新闻 浏览 8795

达成停火18天后战火再起 以总理下令袭击加沙

国际在线 浏览 3542

一群人闯进女子刚买的新房砸了两面墙 物业称出于好心

杭州交通918 浏览 54370

列阵“泰山” 岚图汽车迈入30万辆时代

网易汽车 浏览 3357

地缘因素引爆大宗狂欢!机构上调金价目标至5000美元,白银飙涨近8%,铜价再创里程碑

第一财经资讯 浏览 2698
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1