关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者2659人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

车贷“高息高返”被叫停后:提前还贷需排队,有银行违约金比例最高达15%

时代周报 浏览 3535

近距离感受国之重器:第一视角看亚洲首个电磁弹射微重力实验装置

IT之家 浏览 3768

特朗普称赞高市:如果安倍知道你当首相 肯定非常高兴

第一财经资讯 浏览 13743

郑丽文就职演说让马英九流泪 台媒:他看见蓝营的希望

海峡导报社 浏览 9442

纪念戴安基顿,伍迪艾伦最高杰作告别放映❤️

幕味儿 浏览 2627

美众院通过修正案 或禁止美军从中俄购买数字显示器

澎湃新闻 浏览 26574

巴沙尔倒台,土耳其成最大赢家,最大输家是谁

浏览 26587

网红拍不雅视频发家族群 还在西湖边拦阻路人给其观看

都市快报橙柿互动 浏览 3737

消息称vivo X300s系列手机将搭载7K大电池及2亿主摄

IT之家 浏览 2673

长城魏牌汽车,到底被谁“逼急”了?丨正经深度

正经社 浏览 2670

李想汽车研究院:让AI从"工具使用者"进化为"工具创造者"

科技行者 浏览 2351

"1999年小朋友捐140元给国家造航母"热传 当事人发声

都市快报橙柿互动 浏览 7772

又见天价离婚,冻结上市公司股权34亿!

诗与星空 浏览 3835

何穗孕照被扒!和陈伟霆一举得男,超模都偏爱港男,生娃不办婚礼

萌神木木 浏览 3681

未来智能完成亿元级A轮融资,蚂蚁集团领投、启明创投超额跟投

雷科技 浏览 3782

金工守艺人陈英泽:一锤定音,锻出山川意向

时尚COSMO 浏览 2703

维拉已放弃买断桑乔!曼联若解约多特或引进,只会免费签约不给钱

罗米的曼联博客 浏览 3475

中国小伙赴越南"赚快钱"失联 疑遭拐卖刺伤司机后被捕

封面新闻 浏览 15289

变盘?危险的下注开始了

大猫财经Pro 浏览 2476

是时候考虑购买美国大豆了,为了“拴住”特朗普!

北向财经 浏览 3504

货拉拉等平台被调查

第一财经资讯 浏览 3037
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1