315晚会曝光AI大模型被投毒给AI投毒已成产业链 大模型投毒这个事去年就有消息了,
Anthropic联合英国AI安全研究所(UK AISI)和阿兰·图灵研究所(Alan Turing Institute),发现了一个令人不安的事实:只需250篇恶意网页,就足以让任何规模的语言模型「中毒」。
无论模型大小,只要中毒文档数量达到250篇,攻击几乎百分百成功。即便13B模型训练的数据量是600M模型的20倍,攻击效果仍完全一致。
至于为什么模因污染会成为产业链?原因大家都知道的,把水搅浑好方便一些组织浑水摸鱼