关闭广告

澳大利亚国立大学发现:攻击AI视觉模型只需要操控20%的关键词汇

科技行者2621人阅读


这项由澳大利亚国立大学领导的国际研究团队发表于2025年12月26日的arXiv预印本论文(编号:2512.21815),揭示了一个令人担忧的发现:当今最先进的AI视觉语言模型存在一个严重的安全漏洞,攻击者只需要巧妙地操控20%的关键词汇,就能让这些本应安全可靠的AI系统产生有害内容。

考虑这样一个场景:你正在使用一个AI助手来描述图片内容,比如一张街头摩托车的照片。正常情况下,AI会告诉你"这是一个繁忙的城市街道,有几个人骑着摩托车,他们都戴着头盔"。然而,经过特殊设计的微小图像修改后,同一个AI可能会说出完全不同且危险的内容,声称图片中出现了暴力场景或其他有害内容。更令人担忧的是,这种攻击不需要修改整个AI系统,仅仅针对生成文本中20%的特定位置进行干预就足够了。

研究团队通过深入分析发现,这些AI模型在生成描述时,并非每个词汇都同样重要。就像一个故事中有些情节转折点特别关键一样,AI在生成文本时也有一些"决策点",这些点上的词汇选择会极大影响整个叙述的走向。这些关键位置被研究人员称为"高熵位置",类似于岔路口,选择不同的道路会通向完全不同的目的地。

更加令人不安

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

理想基地获评2025汽车制造超级工厂 AI驱动智造新范式

智车情报局 浏览 3074

寒风中南京数十名民工扒在桥栏上吃午饭 附近摊主发声

扬子晚报 浏览 8394

跨年晚会主持人状态曝光!靳梦佳被质疑整容

萌神木木 浏览 2806

东方通4年虚增3.14亿利润,两家审计机构为何失守?

翠鸟资本 浏览 4424

神奇少帅诞生!陈涛2战6分上岸,媒体人狂赞:比不靠谱洋帅强多了

奥拜尔 浏览 3620

中国斡旋泰柬停火后又单独援助柬方 鲁比奥作奇怪表态

时时有聊 浏览 24521

上市近30年终落幕,天茂集团主动退市

虎投邦 浏览 3838

成龙满嘴谎话?却被兄弟公开指责吝啬人品差?

小娱乐悠悠 浏览 3768

尤斯特:我目前核心目标是保持巴萨稳定,让球队不受外部干扰

懂球帝 浏览 1765

从“土三轮”到“全球潮品”,徐州丰县的“三蹦子”何以“闯世界”

澎湃新闻 浏览 3669

德国军方举行演习被当地警方误判为“威胁” 遭警方实弹还击

环球网资讯 浏览 3540

腾讯元宝派宣布支持接入OpenClaw

环球网资讯 浏览 1660

MIT所长涉嫌图片操纵,《自然》发布关注声明

知识分子 浏览 4297

周杰伦蹭霉霉热度翻车!又被质疑崇洋媚外,近些年口碑越来越差

萌神木木 浏览 3598

司晓迪隐藏聊天记录牵扯背后产业链!上不了热搜,一深扒就删帖

萌神木木 浏览 2791

WLTC纯电续航180km 比亚迪海獭正式亮相

车质网 浏览 3619

卷首语|这届年轻人,全员渡劫奥德赛

时尚COSMO 浏览 318

2026年AI赛道群雄逐鹿,跨国车企巨头如何摆兵布阵?

禾颜阅车 浏览 2651

对话钦培吉:77岁的莲花,不做六边形战士

网易汽车 浏览 4157

奔驰/宝马/奥迪销量集体下滑,谁也逃不过以价换量

郑谊 浏览 2593

拉科布声明未来2年所有人将在一起 这意味着勇士不引援了?

仰卧撑FTUer 浏览 3677
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1