关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者2627人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

莱因克尔:对阵勒沃库森时哈弗茨应首发,他能提供更多东西

懂球帝 浏览 1680

西足协主席谈亚马尔:本应处理得更好,重要的是照顾好球员

懂球帝 浏览 3322

A股继续走牛有底气

IPO日报 浏览 2655

石药集团185亿美元合作背后

YOUNG财经 浏览 2414

"90后"王兴兴:小学时想当科学家 同学一句话启发了我

中国新闻周刊 浏览 8877

男子如厕突发不适后去世 从倒地到失去意识仅1分钟

上观新闻 浏览 3576

我国突破固态电池关键技术瓶颈

大象新闻 浏览 3809

AI让机器写代码变得更聪明:伊利诺伊大学团队破解训练瓶颈新方法

科技行者 浏览 3498

ESPN:若卡塞米罗接受大幅降薪,曼联不排除留下他

懂球帝 浏览 3689

把玄戒O1念成“玄戒零一”,雷军认错:确实是讲错了

三言科技 浏览 2723

自由媒体:F1第一季度营收增长53%,考虑加回一场中东分站

懂球帝 浏览 227

哈梅内伊遇袭身亡 被指已指定暂代最高领袖责任人选

新民周刊 浏览 39955

媒体:河南农民苦 夏天大旱中救活的玉米现在都泡烂了

南风窗 浏览 9220

杜淳带娃吃冰激凌,穿紫色长袜好抢镜,小蛋饺投喂爸爸幸福满溢

扒虾侃娱 浏览 2659

中秋节快乐!

黎贝卡的异想世界 浏览 3113

或搭载激光雷达 长城硬派越野车谍照曝光

车质网 浏览 2952

周星驰罕见发声!盛赞吴宜泽夺冠

今古深日报 浏览 320

"九一八事变"纪念日当天 有些日媒还"警戒"上了

澎湃新闻 浏览 16128

中国男排主帅海宁现身全运会,称需建立不同于女排的培养体系

懂球帝 浏览 3404

从“提效”到“稳进”:2026直播电商进入精耕细作时代

惊蛰研究所 浏览 2575

存储涨价之后,如何让AI走向数据?丨ToB产业观察

钛媒体APP 浏览 321
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1