[paper]Towards Evaluating the Robustness of Neural Networks(C&W)

本文提出了针对Denfensive distillation这种防御措施的C&W算法（基于三种不同距离的对抗样本生成算法），同时也具有一定的迁移性。
本文把构建对抗样本的过程转化为一个最优化问题：
[paper]Towards Evaluating the Robustness of Neural Networks(C&W)
其中 $D$ 是衡量原始图像与对抗样本之间的距离, 三种不同距离分别为 $L_{0}$ 范数 $L_{2}$ 范数和 $L_{\infty }$ 范数。
但由于 $C(x+δ)=t$ 这个问题很难直接求解，因此作者通过构造函数 $f(x,t)$ 使得在 $f(x,t)≤0$ 时，此条件满足。
则问题转换为:
[paper]Towards Evaluating the Robustness of Neural Networks(C&W) 进一步可简化为：
本文给出了7种符合此条件的函数:

为了保证输出能够产生一个合理的图像，需要 $0≤xi+δi≤1$ ，这实际上被称为盒约束 (box constraints)。
本文提出了三种盒约束优化问题的解决方法：

投影梯度下降(Projected gradient descent):每实施一步梯度下降，就把计算结果限制在box内，这种方法对于具有复杂更新步骤的梯度下降方法（例如，具有动量的梯度下降）效果不太好，在剪切真实的 $x_{i}$ 时也修改了下一次迭代的输入。
裁剪梯度下降法(Clipped gradient descent):与每一步迭代裁剪xx的值不同的，该方法将裁剪直接放入了优化目标，即用 $f(min(max(x+δ,0),1))$ 代替原目标函数 $f(x+δ))$ 。但这种方法，只是对目标函数进行了约束，可能会存在 $x_{i}+\delta _{i}$ 超过最大值的情况，这样就会出现梯度为0的结果，以至于 $x_{i}$ 即使减少，梯度上也无法检测到。
改变变量(Change of variables)：通过引入变量 $w_{i}$ ，使得：

且满足 $x_{i}+\delta _{i}∈[0,1]$ 。

据此，本文提出了对应与三种范数约束的求解方法：

$L_{2}$ attack

可以通过调整 $k$ 来控制错误分类发生的置信度。参数 $k$ 鼓励求解器找到一个对抗样本 $x′$ ，被高度置信地归类为 $t$ 类。还可以使用多次随机初始化来减少陷入局部最优解的概率。对于 $L_{2}$ 攻击中常量 $c$ ，本文提出：可以从很小的值开始，例如 $10^{−4}$ ；如果没找到就将 $c$ 翻倍，直至找到或者达到最大值，例如 $10^{10}$ ；如果找到就使用该 $c$ 值。
$L_{0}$ attack
由于 $L_{0}$ 范数不可微，因此不能使用标准的梯度下降法来进行求解。可以基于 $L_{2}$ 攻击来生成 $L_{0}$ 攻击。具体而言，就是先根据 $L_{2}$ 攻击生成扰动向量 $δ$ ，并且令 $g=∇f(x+δ)$ ，然后根据评估函数 $g$ 选择像素 $i=arg\underset{i}{min}g_{i}\cdot \delta _{i}$ （ $g_{i}$ 实际上评估的是像素ii对于输出 $f$ 的影响），然后固定像素 $i$ ，再利用 $L_{2}$ 攻击生成对抗样本，直至无法找到对抗样本为止。
实际上 $L_{0}$ 攻击效果并不是很好。
$L_{\infty }$ attack
对于无穷范数，假设使用公式：
$min\ \ c \cdot f(x+\delta )+\left \| \delta \right \|_{\infty}$
发现梯度下降法的效果并不理想，这是由于 $\left \| \delta \right \|_{\infty}$ 只会惩罚向量中最大的那个元素，而对于其余元素没有任何影响。因此，梯度下降很快就会停滞在两个次优解之间。考虑一个情况，其中 $i=0.5$ 和 $j=0.5−ϵ$ 。 $L_{\infty }$ 只会惩罚 $\delta _{i}$ 而不会惩罚 $\delta _{j}$ 。并且 $\frac{\partial }{\partial \delta _{j}}\left \| \delta \right \|_{\infty}$ 在该点的值为0，因此梯度仍然会增大 $\delta _{i}$ ，尽管它已经很大。因此在下一次迭代中，可能会移动到 $\delta _{j}$ 比 $\delta _{i}$ 略大的位置，比如 $i=0.5−ϵ′$ 和 $j=0.5+ϵ′′$ ，这就可能陷入僵局。换句话说，梯度下降可能在 $\delta _{i}$ = $\delta _{j}$ =0.5的线上来回摆动。
因此可将问题优化如下：

在每次迭代之后，如果对所有的 $i$ 都有 $\delta _{i}< \tau$ ，可以将 $\tau$ 减少0.9倍并重复; 否则，终止搜索。
假设必须选择一个好的常数 $c$ 用于 $L_{\infty }$ 攻击。可以采用与 $L_{0}$ 攻击相同的方法：首先将 $c$ 设置为非常低的值，然后以此 $c$ 值运行 $L_{\infty }$ 攻击。如果失败，加倍 $c$ 并重试，直到成功。如果 $c$ 超过固定阈值，我们中止搜索。
在每次迭代中使用“热启动”进行梯度下降，则该算法的速度与之前的 $L_{2}$ 算法（使用单个起点）一样快。

实验结果：
[paper]Towards Evaluating the Robustness of Neural Networks(C&W)