关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2658人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

金价暴跌后实探北京金店:有消费者拖行李箱“抄底”,回收变现需排队3个半小时

红星新闻 浏览 2413

陈冰挺孕肚陪男友逛街,陈牧驰一脸络腮胡

黄谋仕 浏览 2604

新版《重案六组》来袭!张一山加盟

可乐谈情感 浏览 1651

今日热点:车银优代言广告被隐藏;《巅峰对决》主演担任米兰冬奥会火炬手……

伊周潮流 浏览 2566

8年过后再看冯小刚亲选的“芳华三美”

大铁猫娱乐 浏览 3561

以军称地面攻势要打数月 以防长:加沙正在燃烧

新华社 浏览 4452

翁虹女儿18岁成人及笄礼惊艳全网

艳姐的搞笑视频 浏览 3698

德黑兰上空传出爆炸声 以色列回应

央视新闻客户端 浏览 503

沃什被提名次日 特朗普:不降息就把他告到裤子都不剩

极目新闻 浏览 8957

弗里克:相信阿隆索会有新工作;坎塞洛明天有可能上

懂球帝 浏览 2670

友人追忆杨振宁:他其实还有一个遗憾

大象新闻 浏览 3733

3月5日将上市 比亚迪海豹07EV有望搭载闪充技术

网易汽车 浏览 1996

内存成本持续大涨,买手机电脑会越来越贵该怪谁?

江瀚视野 浏览 2649

她的发型又火了!年底做头发,不妨从这篇找找灵感

黎贝卡的异想世界 浏览 2770

曲婉婷近照疑曝光!眼神闪躲像躲债

小徐讲八卦 浏览 2649

阔腿裤失宠了?这4条裤子承包你整个春天的时髦!

LinkFashion 浏览 2096

特斯拉第三季度财报亮点:交付创新高,能源业务强势领跑

不看车bukanche 浏览 3530

阿联酋突然退出欧佩克 被视为是"特朗普的一次胜利"

红星新闻 浏览 30366

燃油车的“智能”反击!2025广州车展燃油新车盘点

车市红点 浏览 3221

行业「寒风」尤劲,龙头企业华润三九能否「独善其身」

节点财经 浏览 3633

想年前用3周“刷新”好状态?做第一点就够

黎贝卡的异想世界 浏览 2412
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1