关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者2625人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

突破LLM遗忘瓶颈,谷歌「嵌套学习」让AI像人脑一样持续进化

机器之心Pro 浏览 3488

E句话| 他们都离婚了?

仙女事件簿 浏览 3031

米仓凉子涉毒被抓!当小三、遭家暴、交往瘾君子,50岁人生一团糟

萌神木木 浏览 3918

邻居在家门口干了匪夷所思的事 杭州女子:提心吊胆

极目新闻 浏览 33409

跻身世界第一梯队!这一行业,迎爆发风口

环球网资讯 浏览 3774

以称打死两名越过加沙地带“黄线”人员

环球网资讯 浏览 3469

《狂野时代》外网爆口碑!西方观众惊叹,中国连电影都遥遥领先

娱乐圈笔娱君 浏览 3324

马卡:卡瓦哈尔对现状不满,在替补席上也无队长应有的领导力

懂球帝 浏览 1098

50+女人这么穿,简单款一样搭出“有钱人”的感觉,时髦利落

静儿时尚达人 浏览 5685

患癌母亲"碰瓷"货车司机 儿子怒斥母亲后赔司机3000元

北青深一度 浏览 8975

卫宁健康实控人周炜犯单位行贿罪一审获刑一年半,其子被提名为非独董

红星资本局 浏览 3514

新年的“一抹红”,这样穿惊艳全场

Yuki女人故事 浏览 2563

德雷森:格雷茨卡本赛季不走;我们将择机与凯恩开启续约谈判

懂球帝 浏览 2667

科瓦奇:本塞拜尼能出战奥格斯堡;迪朗维尔先去二队恢复体能

懂球帝 浏览 3510

挪威队主帅:我们和阿森纳达成协议,厄德高不会在世预赛出场

懂球帝 浏览 3566

专访顶新便利餐饮 游仁宏:便利店的核心壁垒,是人与温度

新零售财经 浏览 3704

若乌方试图袭击克宫俄方将作何反应 佩斯科夫表态

环球网资讯 浏览 4250

美政府"关门"将结束 民主党8人倒戈加入共和党人行列

红星新闻 浏览 34363

美官员:特朗普不满伊朗新提案 核问题须优先解决

界面新闻 浏览 486

福建舰、山东舰、辽宁舰 作战能力不止“1+1+1”

上观新闻 浏览 3327

车长5米3 华为乾崑奕境首款旗舰大六座SUV定名X9

网易汽车 浏览 741
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1