关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者3187人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

以总理:将确保哈马斯解除武装

国际在线 浏览 4187

沉默的荣耀大结局前瞻,最惨角色出炉,果然不幸的人各有各的不幸

娱乐圈笔娱君 浏览 4265

拼多多新质供给一周年:新质商品SKU数增长超五成,产业加速新质转型

财闻 浏览 4843

俄军中将在汽车炸弹爆炸中身亡 现场画面披露

央视新闻客户端 浏览 3444

P图只用一句话,小米超级小爱AI大模型“随心修图”上线

IT之家 浏览 3869

日本球迷惊呆:中国队4场1球进了4强? 刘建宏:我们愿一直苟着?

风过乡 浏览 3178

科学家重构常见抗癌药物:使其疗效提升两万倍,同时副作用更低

IT之家 浏览 3958

跟队:在无缘坎塞洛之后,国米目前并没有明确任何引援替代者

懂球帝 浏览 3242

胡歌、黄晓明、关晓彤齐聚,央视2026片单炸了

手工制作阿歼 浏览 3069

Meta实验室革命性并行推理技术:让AI模型思考速度提升50%

科技行者 浏览 3285

广东U20 1-0上海U20,张志雄绝杀

懂球帝 浏览 3980

窦靖童帮帮唱,亲妈亲爸继父四选一你选谁?

TVB的四小花 浏览 109

从2499到3299:Rokid还要收割几次信任?

蓝鲸新闻 浏览 4774

37岁生日变冷清,杨颖人设崩塌后的人情冷暖

花语舞者 浏览 2467

除了“薄底鞋”,今年最流行这5双鞋,怎么搭都好看!

LinkFashion 浏览 1114

始祖鸟陷“炸山”风波 安踏回应

每日经济新闻 浏览 26374

做好服务的老国货们,率先进入顺风局

财经无忌 浏览 3065

今年冬天最火的穿法:夹克+裤子,时髦又减龄!

LinkFashion 浏览 3270

美将暂停实施对华海事等301调查措施一年

财联社 浏览 10297

5年20款新50万辆野心:现代汽车在内卷中寻找"确定性"

网易汽车 浏览 1155

利物浦女足前主帅比尔德的葬礼举行,超过六百人参加

懂球帝 浏览 4255
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1