内容安全复习 7 - 对抗攻击与防御
对抗性攻击概述、对抗性攻击、对抗性攻击的防御。
论文导读:Universal Adversarial Training
在这篇论文中,作者提出了一种优化的方法来找到给定模型的通用对抗样本(首先在 Moosavi-Desfooli 等人 [1] 中引入)。作者还提出了一种低成本算法来增强模型对此类扰动的鲁棒性。
对抗性攻击的原理简介
由于机器学习算法的输入形式是一种数值型向量(numeric vectors),所以攻击者就会通过设计一种有针对性的数值型向量从而让机器学习模型做出误判,这便被称为对抗性攻击。