关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者3128人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

维拉已放弃买断桑乔!曼联若解约多特或引进,只会免费签约不给钱

罗米的曼联博客 浏览 4020

网友曝姚晨新欢是侯雯元!女方逼男方和钟楚曦分手,二人交集被扒

萌神木木 浏览 2210

P图只用一句话,小米超级小爱AI大模型“随心修图”上线

IT之家 浏览 3871

美防长称外国要在美国本土建军事基地 惹怒特朗普拥趸

新民周刊 浏览 7118

日均排队超千桌!“反预制”的年轻人捧红了地方菜

餐饮老板内参 浏览 3589

票房会破10亿?看完《阿凡达3》后,我极其冷静地,写下这篇文章

皮皮电影 浏览 3401

洪九果品响退市警报,“榴莲大王”梦断资本路

斑马消费 浏览 4323

小S的第3个女儿发自拍照,14岁就很漂亮,外形完成惊艳蜕变

素素娱乐 浏览 2597

逍遥大结局:看到最后,这个曾经最可恨的妖,却是全剧喜剧人之首

肆季娱乐 浏览 3288

比卢普斯律师声明:他是个正直的人,不会用自己的名誉冒险

懂球帝 浏览 4047

抄底时刻已至?新荣记、胡晓明联手入股西贝

首席商业评论 浏览 3046

与AI机器人同行,中山万人徒步共迎新年

南方都市报 浏览 3348

以军先斩后奏空袭加沙多地 特朗普:以色列没做错

上观新闻 浏览 3220

黄绮珊在何晴去世首发,10年悄悄祈福

新金牌娱乐观察家 浏览 3619

A股董事被拘!涉嫌违法放贷,早年工行履历被关注

财通社 浏览 4390

安东尼:我们会就我的红牌上诉,裁判也知道我的动作没有恶意

懂球帝 浏览 3738

A股2025年分红额创历史新高 分红次数居前上市公司名单一览

财联社 浏览 3410

雷军在京喊话:共同抵制网络水军、黑公关

大象新闻 浏览 4275

好美啊!58岁的她开挂了

黎贝卡的异想世界 浏览 3197

营销悍将赵长江加盟智界,放言智界V9三年内无对手!

车市红点 浏览 3265

军报评何卫东、苗华等被开除党籍军籍:没有"铁帽子王"

北京日报客户端 浏览 10326
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1