0


对抗子空间维度探讨

引言

对抗样本是深度学习模型的主要威胁之一,对抗样本会使得目标分类器模型分类出错并且它存在于稠密的对抗子空间中,对抗子空间又包含于特定的样本空间中。本文主要是对对抗子空间维数进行探讨,即针对于单个模型的特定样本对抗子空间的维度是多少,针对多个模型的特定样本对抗子空间的维度是多少。

对抗子空间

给定干净样本

     x
    
    
     ∈
    
    
     
      R
     
     
      d
     
    
   
   
    x\in \mathbb{R}^d
   
  
 x∈Rd,以及其对应的标签
 
  
   
    
     y
    
   
   
    y
   
  
 y,带有参数
 
  
   
    
     θ
    
   
   
    \theta
   
  
 θ的神经网络分类器为
 
  
   
    
     
      f
     
     
      θ
     
    
    
     (
    
    
     ⋅
    
    
     )
    
   
   
    f_\theta(\cdot)
   
  
 fθ​(⋅),损失函数为
 
  
   
    
     J
    
    
     (
    
    
     x
    
    
     ,
    
    
     y
    
    
     ;
    
    
     θ
    
    
     )
    
   
   
    J(x,y;\theta)
   
  
 J(x,y;θ),对抗样本为
 
  
   
    
     
      x
     
     
      ′
     
    
   
   
    x^{\prime}
   
  
 x′,则根据多元泰勒展开式可得
  
   
    
     
      J
     
     
      (
     
     
      
       x
      
      
       ′
      
     
     
      ,
     
     
      y
     
     
      ;
     
     
      θ
     
     
      )
     
     
      =
     
     
      J
     
     
      (
     
     
      x
     
     
      ,
     
     
      y
     
     
      ;
     
     
      θ
     
     
      )
     
     
      +
     
     
      (
     
     
      
       x
      
      
       ′
      
     
     
      −
     
     
      x
     
     
      
       )
      
      
       ⊤
      
     
     
      
       ∇
      
      
       x
      
     
     
      J
     
     
      (
     
     
      x
     
     
      ,
     
     
      y
     
     
      ;
     
     
      θ
     
     
      )
     
     
      +
     
     
      O
     
     
      (
     
     
      ∥
     
     
      
       x
      
      
       ′
      
     
     
      −
     
     
      x
     
     
      
       ∥
      
      
       2
      
     
     
      )
     
    
    
     J(x^{\prime},y;\theta)=J(x,y;\theta)+(x^{\prime}-x)^{\top}\nabla_x J(x,y;\theta)+O(\|x^{\prime}-x\|^2)
    
   
  J(x′,y;θ)=J(x,y;θ)+(x′−x)⊤∇x​J(x,y;θ)+O(∥x′−x∥2)进一步可得优化目标为
  
   
    
     
      
       
        
         
          m
         
         
          a
         
         
          x
         
         
          i
         
         
          m
         
         
          i
         
         
          z
         
         
          e
         
        
       
      
      
       
        
         
          J
         
         
          (
         
         
          x
         
         
          ,
         
         
          y
         
         
          ;
         
         
          θ
         
         
          )
         
         
          +
         
         
          (
         
         
          
           x
          
          
           ′
          
         
         
          −
         
         
          x
         
         
          
           )
          
          
           ⊤
          
         
         
          
           ∇
          
          
           x
          
         
         
          J
         
         
          (
         
         
          x
         
         
          ,
         
         
          y
         
         
          ;
         
         
          θ
         
         
          )
         
        
       
      
     
     
      
       
        
         
          s
         
         
          u
         
         
          b
         
         
          j
         
         
          e
         
         
          c
         
         
          t
         
         
           
         
         
          t
         
         
          o
         
        
       
      
      
       
        
         
          ∥
         
         
          
           x
          
          
           ′
          
         
         
          −
         
         
          x
         
         
          
           ∥
          
          
           ∞
          
         
         
          ≤
         
         
          ε
         
        
       
      
     
    
    
     \begin{array}{rl}\mathrm{maximize}& J(x,y;\theta)+(x^{\prime}-x)^{\top}\nabla_x J(x,y;\theta)\\\mathrm{subject \text{ }to}& \|x^{\prime}-x\|_{\infty} \le \varepsilon\end{array}
    
   
  maximizesubject to​J(x,y;θ)+(x′−x)⊤∇x​J(x,y;θ)∥x′−x∥∞​≤ε​进而可得对抗样本的计算公式为
  
   
    
     
      
       x
      
      
       ′
      
     
     
      =
     
     
      x
     
     
      +
     
     
      ε
     
     
      ⋅
     
     
      
       ∇
      
      
       x
      
     
     
      J
     
     
      (
     
     
      x
     
     
      ,
     
     
      y
     
     
      ;
     
     
      θ
     
     
      )
     
    
    
     x^{\prime}=x+\varepsilon \cdot\nabla_x J(x,y;\theta)
    
   
  x′=x+ε⋅∇x​J(x,y;θ)其中
 
  
   
    
     ε
    
   
   
    \varepsilon
   
  
 ε表示的是对抗扰动的大小。由上公式可知,干净样本
 
  
   
    
     x
    
   
   
    x
   
  
 x沿着梯度方向
 
  
   
    
     
      ∇
     
     
      x
     
    
    
     J
    
    
     (
    
    
     x
    
    
     ,
    
    
     y
    
    
     ;
    
    
     θ
    
    
     )
    
   
   
    \nabla_x J(x,y;\theta)
   
  
 ∇x​J(x,y;θ)可以进入到对抗子空间中。进一步详细的阐述如下图所示,其中图(a),(b)和(c)表示的是给定一个干净样本沿着不同的方向生成的样本输入到分类器分类的结果示意图,每个方格表示每一个样本的分类结果,方格中白色表示分类器分类正确,彩色表示分类器分类成其它不同的类别。图(d) ,(e)和(f)表示样本移动的方向分解示意图。

在这里插入图片描述
由上图(d)可知,如果选择两个正交方向,一个是对抗扰动的梯度方向,另一个是随机扰动方向,从图(a)可知,沿着对抗扰动方向的干净样本可以进入到对抗子空间中,沿着随机扰动的方向则没有生成对抗样本。由上图(e)可知,如果这两个正交方向与梯度方向成一个角度,则从图(b)可知这两个正交方向都可以进入到对抗子空间中,但是却不是最速方向。由上图(f)可知,如果这两个正交方向是都是随机扰动,从图(c)可知,干净样本都很难进入到对抗子空间中去,该图出现误分类的情况与对抗样本无关,跟模型自身的训练情况有关。

单模型对抗子空间维数

由上一节对对抗样本损失函数的多元泰勒展开可以近似有

      J
     
     
      (
     
     
      
       x
      
      
       ′
      
     
     
      ,
     
     
      y
     
     
      ;
     
     
      θ
     
     
      )
     
     
      ≈
     
     
      J
     
     
      (
     
     
      x
     
     
      ,
     
     
      
       y
      
      
       ′
      
     
     
      ;
     
     
      θ
     
     
      )
     
     
      +
     
     
      (
     
     
      
       x
      
      
       ′
      
     
     
      −
     
     
      x
     
     
      
       )
      
      
       ⊤
      
     
     
      
       ∇
      
      
       x
      
     
     
      J
     
     
      (
     
     
      x
     
     
      ,
     
     
      y
     
     
      ;
     
     
      θ
     
     
      )
     
    
    
     J(x^{\prime},y;\theta)\approx J(x,y';\theta)+(x^{\prime}-x)^{\top} \nabla_x J(x,y;\theta)
    
   
  J(x′,y;θ)≈J(x,y′;θ)+(x′−x)⊤∇x​J(x,y;θ)其中令
 
  
   
    
     g
    
    
     =
    
    
     
      ∇
     
     
      x
     
    
    
     J
    
    
     (
    
    
     x
    
    
     ,
    
    
     y
    
    
     ;
    
    
     θ
    
    
     )
    
    
     ∈
    
    
     
      R
     
     
      d
     
    
   
   
    g = \nabla_x J(x,y;\theta)\in \mathbb{R}^d
   
  
 g=∇x​J(x,y;θ)∈Rd,
 
  
   
    
     r
    
    
     =
    
    
     (
    
    
     
      x
     
     
      ′
     
    
    
     −
    
    
     x
    
    
     )
    
    
     ∈
    
    
     
      R
     
     
      d
     
    
   
   
    r = (x^{\prime}-x)\in \mathbb{R}^d
   
  
 r=(x′−x)∈Rd。目的是要探究给定一个模型,求解对抗扰动
 
  
   
    
     r
    
   
   
    r
   
  
 r使得模型损失函数至少增长
 
  
   
    
     α
    
   
   
    \alpha
   
  
 α得对抗子空间维度的问题,数学表述为
  
   
    
     
      
       
        
         
          J
         
         
          (
         
         
          
           x
          
          
           ′
          
         
         
          ,
         
         
          y
         
         
          ;
         
         
          θ
         
         
          )
         
         
          −
         
         
          J
         
         
          (
         
         
          x
         
         
          ,
         
         
          y
         
         
          ;
         
         
          θ
         
         
          )
         
        
       
      
      
       
        
         
         
          =
         
         
          
           r
          
          
           ⊤
          
         
         
          g
         
         
          ≥
         
         
          α
         
        
       
      
     
    
    
     \begin{aligned}J(x^{\prime},y;\theta)-J(x,y;\theta)&=r^{\top} g\ge \alpha\\\end{aligned}
    
   
  J(x′,y;θ)−J(x,y;θ)​=r⊤g≥α​其中
 
  
   
    
     r
    
    
     ∈
    
    
     
      S
     
     
      p
     
     
      a
     
     
      n
     
    
    
     {
    
    
     
      r
     
     
      1
     
    
    
     ,
    
    
     
      r
     
     
      2
     
    
    
     ⋯
     
    
     ,
    
    
     
      r
     
     
      k
     
    
    
     }
    
   
   
    r \in \mathrm{Span}\{r_1,r_2\cdots,r_k\}
   
  
 r∈Span{r1​,r2​⋯,rk​},即扰动
 
  
   
    
     r
    
   
   
    r
   
  
 r属于
 
  
   
    
     
      r
     
     
      1
     
    
    
     ,
    
    
     
      r
     
     
      2
     
    
    
     ,
    
    
     ⋯
     
    
     ,
    
    
     
      r
     
     
      k
     
    
   
   
    r_1,r_2,\cdots,r_k
   
  
 r1​,r2​,⋯,rk​这
 
  
   
    
     k
    
   
   
    k
   
  
 k个正交向量组成的对抗子空间中,
 
  
   
    
     k
    
   
   
    k
   
  
 k就是对抗子空间的维度。此时有如下定理成立,详细证明过程如下所示:

定理: 给定

      g
     
     
      ∈
     
     
      
       R
      
      
       d
      
     
    
    
     g \in \mathbb{R}^{d}
    
   
  g∈Rd 和 
  
   
    
     
      α
     
     
      ∈
     
     
      [
     
     
      0
     
     
      ,
     
     
      1
     
     
      ]
     
    
    
     \alpha \in[0,1]
    
   
  α∈[0,1],最大对抗子空间维数
  
   
    
     
      k
     
    
    
     k
    
   
  k的正交向量
  
   
    
     
      
       r
      
      
       1
      
     
     
      ,
     
     
      
       r
      
      
       2
      
     
     
      ,
     
     
      …
     
     
      ,
     
     
      
       r
      
      
       k
      
     
    
    
     r_1,r_2,\ldots,r_k
    
   
  r1​,r2​,…,rk​ 满足
  
   
    
     
      
       
        ∥
       
       
        
         r
        
        
         i
        
       
       
        ∥
       
      
      
       2
      
     
     
      ≤
     
     
      1
     
    
    
     \left\|r_{i}\right\|_{2} \leq 1
    
   
  ∥ri​∥2​≤1,
  
   
    
     
      
       g
      
      
       ⊤
      
     
     
      
       r
      
      
       i
      
     
     
      ≥
     
     
      α
     
     
      ⋅
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
     
    
    
     g^{\top} r_{i} \geq \alpha \cdot\|g\|_{2}
    
   
  g⊤ri​≥α⋅∥g∥2​的充要条件是
  
   
    
     
      k
     
     
      =
     
     
      min
     
     
      ⁡
     
     
      
       {
      
      
       
        ⌊
       
       
        
         1
        
        
         
          α
         
         
          2
         
        
       
       
        ⌋
       
      
      
       ,
      
      
       d
      
      
       }
      
     
    
    
     k=\min \left\{\left\lfloor\frac{1}{\alpha^{2}}\right\rfloor, d\right\}
    
   
  k=min{⌊α21​⌋,d}。

证明:
必要性证明: 已知

     g
    
    
     ∈
    
    
     
      R
     
     
      d
     
    
   
   
    g \in \mathbb{R}^{d}
   
  
 g∈Rd 和 
 
  
   
    
     α
    
    
     ∈
    
    
     [
    
    
     0
    
    
     ,
    
    
     1
    
    
     ]
    
   
   
    \alpha \in[0,1]
   
  
 α∈[0,1],令
 
  
   
    
     
      
       r
      
      
       ^
      
     
     
      i
     
    
    
     :
    
    
     =
    
    
     
      
       r
      
      
       i
      
     
     
      
       
        ∥
       
       
        
         r
        
        
         i
        
       
       
        ∥
       
      
      
       2
      
     
    
   
   
    \hat{r}_{i}:=\frac{r_{i}}{\left\|r_{i}\right\|_{2}}
   
  
 r^i​:=∥ri​∥2​ri​​,并且
 
  
   
    
     
      r
     
     
      1
     
    
    
     ,
    
    
     
      r
     
     
      2
     
    
    
     ,
    
    
     …
    
    
     ,
    
    
     
      r
     
     
      k
     
    
   
   
    r_{1}, r_{2}, \ldots, r_{k}
   
  
 r1​,r2​,…,rk​是正交的,由此可知
 
  
   
    
     k
    
    
     ≤
    
    
     d
    
   
   
    k \leq d
   
  
 k≤d。

(1)如果

     k
    
    
     =
    
    
     d
    
   
   
    k = d
   
  
 k=d,则由向量乘积公式可知:
  
   
    
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       k
      
     
     
      
       
        ∣
       
       
        
         g
        
        
         ⊤
        
       
       
        
         
          r
         
         
          ^
         
        
        
         i
        
       
       
        ∣
       
      
      
       2
      
     
     
      =
     
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       d
      
     
     
      
       
        ∣
       
       
        
         g
        
        
         ⊤
        
       
       
        
         
          r
         
         
          ^
         
        
        
         i
        
       
       
        ∣
       
      
      
       2
      
     
     
      =
     
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       d
      
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
     
      ∥
     
     
      
       
        r
       
       
        ^
       
      
      
       i
      
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
     
      
       
        cos
       
       
        ⁡
       
      
      
       2
      
     
     
      
       α
      
      
       i
      
     
    
    
     \sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2}=\sum_{i=1}^{d}\left|g^{\top} \hat{r}_{i}\right|^{2} = \sum_{i=1}^{d} \|g\|_{2}^{2} \|\hat{r}_{i}\|_{2}^{2} \cos^{2} \alpha_{i}
    
   
  i=1∑k​∣∣​g⊤r^i​∣∣​2=i=1∑d​∣∣​g⊤r^i​∣∣​2=i=1∑d​∥g∥22​∥r^i​∥22​cos2αi​其中,
 
  
   
    
     cos
    
    
     ⁡
    
    
     
      α
     
     
      i
     
    
   
   
    \cos \alpha_{i}
   
  
 cosαi​ 表示的是向量
 
  
   
    
     g
    
   
   
    g
   
  
 g和
 
  
   
    
     
      
       r
      
      
       ^
      
     
     
      i
     
    
   
   
    \hat{r}_{i}
   
  
 r^i​的余弦值,并且又知道
 
  
   
    
     ∥
    
    
     
      
       r
      
      
       ^
      
     
     
      i
     
    
    
     
      ∥
     
     
      2
     
     
      2
     
    
    
     =
    
    
     1
    
   
   
    \|\hat{r}_{i}\|_{2}^{2}=1
   
  
 ∥r^i​∥22​=1,所以有
  
   
    
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       d
      
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
     
      ∥
     
     
      
       
        r
       
       
        ^
       
      
      
       i
      
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
     
      
       
        cos
       
       
        ⁡
       
      
      
       2
      
     
     
      
       α
      
      
       i
      
     
     
      =
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       d
      
     
     
      
       
        cos
       
       
        ⁡
       
      
      
       2
      
     
     
      
       α
      
      
       i
      
     
     
      =
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
    
    
     \sum_{i=1}^{d} \|g\|_{2}^{2} \|\hat{r}_{i}\|_{2}^{2} \cos^{2} \alpha_{i} = \|g\|_{2}^{2} \sum_{i=1}^{d} \cos^{2} \alpha_{i} = \|g\|_{2}^{2}
    
   
  i=1∑d​∥g∥22​∥r^i​∥22​cos2αi​=∥g∥22​i=1∑d​cos2αi​=∥g∥22​进而则有
  
   
    
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       k
      
     
     
      
       
        ∣
       
       
        
         g
        
        
         ⊤
        
       
       
        
         
          r
         
         
          ^
         
        
        
         i
        
       
       
        ∣
       
      
      
       2
      
     
     
      =
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
    
    
     \sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2} = \|g\|_{2}^{2}
    
   
  i=1∑k​∣∣​g⊤r^i​∣∣​2=∥g∥22​

(2)如果

     k
    
    
     <
    
    
     d
    
   
   
    k < d
   
  
 k<d,则先对
 
  
   
    
     
      r
     
     
      1
     
    
    
     ,
    
    
     
      r
     
     
      2
     
    
    
     ,
    
    
     …
    
    
     ,
    
    
     
      r
     
     
      k
     
    
   
   
    r_{1}, r_{2}, \ldots, r_{k}
   
  
 r1​,r2​,…,rk​进行正交扩充,扩充为
  
   
    
     
      
       r
      
      
       1
      
     
     
      ,
     
     
      
       r
      
      
       2
      
     
     
      ,
     
     
      …
     
     
      ,
     
     
      
       r
      
      
       k
      
     
     
      ,
     
     
      
       r
      
      
       
        k
       
       
        +
       
       
        1
       
      
     
     
      ,
     
     
      …
     
     
      ,
     
     
      
       r
      
      
       d
      
     
    
    
     r_{1}, r_{2}, \ldots, r_{k}, r_{k+1},\ldots, r_{d}
    
   
  r1​,r2​,…,rk​,rk+1​,…,rd​则可知
  
   
    
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       k
      
     
     
      
       
        ∣
       
       
        
         g
        
        
         ⊤
        
       
       
        
         
          r
         
         
          ^
         
        
        
         i
        
       
       
        ∣
       
      
      
       2
      
     
     
      <
     
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       d
      
     
     
      
       
        ∣
       
       
        
         g
        
        
         ⊤
        
       
       
        
         
          r
         
         
          ^
         
        
        
         i
        
       
       
        ∣
       
      
      
       2
      
     
     
      =
     
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       d
      
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
     
      ∥
     
     
      
       
        r
       
       
        ^
       
      
      
       i
      
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
     
      
       
        cos
       
       
        ⁡
       
      
      
       2
      
     
     
      
       α
      
      
       i
      
     
     
      =
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
    
    
     \sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2}< \sum_{i=1}^{d}\left|g^{\top} \hat{r}_{i}\right|^{2} = \sum_{i=1}^{d} \|g\|_{2}^{2} \|\hat{r}_{i}\|_{2}^{2} \cos^{2} \alpha_{i} = \|g\|_{2}^{2}
    
   
  i=1∑k​∣∣​g⊤r^i​∣∣​2<i=1∑d​∣∣​g⊤r^i​∣∣​2=i=1∑d​∥g∥22​∥r^i​∥22​cos2αi​=∥g∥22​进而可知
  
   
    
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
     
      ≥
     
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       k
      
     
     
      
       
        ∣
       
       
        
         g
        
        
         ⊤
        
       
       
        
         
          r
         
         
          ^
         
        
        
         i
        
       
       
        ∣
       
      
      
       2
      
     
    
    
     \|g\|_{2}^{2} \geq \sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2}
    
   
  ∥g∥22​≥i=1∑k​∣∣​g⊤r^i​∣∣​2又因为
 
  
   
    
     
      
       r
      
      
       ^
      
     
     
      i
     
    
    
     :
    
    
     =
    
    
     
      
       r
      
      
       i
      
     
     
      
       
        ∥
       
       
        
         r
        
        
         i
        
       
       
        ∥
       
      
      
       2
      
     
    
   
   
    \hat{r}_{i}:=\frac{r_{i}}{\left\|r_{i}\right\|_{2}}
   
  
 r^i​:=∥ri​∥2​ri​​,所以有
  
   
    
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       k
      
     
     
      
       
        ∣
       
       
        
         g
        
        
         ⊤
        
       
       
        
         
          r
         
         
          ^
         
        
        
         i
        
       
       
        ∣
       
      
      
       2
      
     
     
      =
     
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       k
      
     
     
      
       
        ∣
       
       
        
         g
        
        
         ⊤
        
       
       
        
         
          r
         
         
          i
         
        
        
         
          
           ∥
          
          
           
            r
           
           
            i
           
          
          
           ∥
          
         
         
          2
         
        
       
       
        ∣
       
      
      
       2
      
     
     
      ≥
     
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       k
      
     
     
      
       
        
         ∣
        
        
         
          g
         
         
          ⊤
         
        
        
         
          r
         
         
          i
         
        
        
         ∣
        
       
       
        2
       
      
      
       
        
         ∥
        
        
         
          r
         
         
          i
         
        
        
         ∥
        
       
       
        2
       
       
        2
       
      
     
    
    
     \sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2} = \sum_{i=1}^{k}\left|g^{\top} \frac{r_{i}}{\left\|r_{i}\right\|_{2}} \right|^{2} \geq \sum_{i=1}^{k} \frac{\left|g^{\top} r_{i}\right|^{2}}{\left\|r_{i}\right\|_{2}^{2}}
    
   
  i=1∑k​∣∣​g⊤r^i​∣∣​2=i=1∑k​∣∣∣∣​g⊤∥ri​∥2​ri​​∣∣∣∣​2≥i=1∑k​∥ri​∥22​∣∣​g⊤ri​∣∣​2​

因为

      g
     
     
      ⊤
     
    
    
     
      r
     
     
      i
     
    
    
     ≥
    
    
     α
    
    
     ⋅
    
    
     ∥
    
    
     g
    
    
     
      ∥
     
     
      2
     
    
   
   
    g^{\top} r_{i} \geq \alpha \cdot\|g\|_{2}
   
  
 g⊤ri​≥α⋅∥g∥2​,
 
  
   
    
     
      
       ∥
      
      
       
        r
       
       
        i
       
      
      
       ∥
      
     
     
      2
     
    
    
     ≤
    
    
     1
    
   
   
    \left\|r_{i}\right\|_{2} \leq 1
   
  
 ∥ri​∥2​≤1,所以有
  
   
    
     
      
       ∑
      
      
       
        i
       
       
        =
       
       
        1
       
      
      
       k
      
     
     
      
       
        
         ∣
        
        
         
          g
         
         
          ⊤
         
        
        
         
          r
         
         
          i
         
        
        
         ∣
        
       
       
        2
       
      
      
       
        
         ∥
        
        
         
          r
         
         
          i
         
        
        
         ∥
        
       
       
        2
       
       
        2
       
      
     
     
      ≥
     
     
      k
     
     
      ⋅
     
     
      
       α
      
      
       2
      
     
     
      ⋅
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
      
       2
      
     
    
    
     \sum_{i=1}^{k} \frac{\left|g^{\top} r_{i}\right|^{2}}{\left\|r_{i}\right\|_{2}^{2}} \geq k \cdot \alpha^{2} \cdot\|g\|_{2}^{2}
    
   
  i=1∑k​∥ri​∥22​∣∣​g⊤ri​∣∣​2​≥k⋅α2⋅∥g∥22​又因为
  
   
    
     
      k
     
     
      ≤
     
     
      
       ⌊
      
      
       
        1
       
       
        
         α
        
        
         2
        
       
      
      
       ⌋
      
     
    
    
      k \leq \left\lfloor\frac{1}{\alpha^{2}}\right\rfloor
    
   
  k≤⌊α21​⌋

最终有

      max
     
     
      ⁡
     
     
      {
     
     
      k
     
     
      }
     
     
      =
     
     
      min
     
     
      ⁡
     
     
      {
     
     
      
       ⌊
      
      
       
        1
       
       
        
         α
        
        
         2
        
       
      
      
       ⌋
      
     
     
      ,
     
     
      d
     
     
      }
     
    
    
     \max\{k\} = \min\{ \left\lfloor\frac{1}{\alpha^{2}}\right\rfloor,d\}
    
   
  max{k}=min{⌊α21​⌋,d}

充分性证明: 已知

     k
    
    
     =
    
    
     min
    
    
     ⁡
    
    
     
      {
     
     
      
       ⌊
      
      
       
        1
       
       
        
         α
        
        
         2
        
       
      
      
       ⌋
      
     
     
      ,
     
     
      d
     
     
      }
     
    
   
   
    k=\min \left\{\left\lfloor\frac{1}{\alpha^{2}}\right\rfloor, d\right\}
   
  
 k=min{⌊α21​⌋,d},令
 
  
   
    
     
      e
     
     
      1
     
    
    
     ,
    
    
     
      e
     
     
      2
     
    
    
     ,
    
    
     …
    
    
     ,
    
    
     
      e
     
     
      d
     
    
   
   
    e_{1}, e_{2}, \dots, e_{d}
   
  
 e1​,e2​,…,ed​表示的是
 
  
   
    
     
      R
     
     
      d
     
    
   
   
    \mathbb{R}_{d}
   
  
 Rd​的基向量,
 
  
   
    
     R
    
   
   
    R
   
  
 R为旋转矩阵并且有
 
  
   
    
     R
    
    
     g
    
    
     =
    
    
     ∥
    
    
     g
    
    
     
      ∥
     
     
      2
     
    
    
     ⋅
    
    
     
      e
     
     
      1
     
    
   
   
    R g=\|g\|_{2} \cdot e_{1}
   
  
 Rg=∥g∥2​⋅e1​。 令
 
  
   
    
     z
    
    
     :
    
    
     =
    
    
     
      ∑
     
     
      
       i
      
      
       =
      
      
       1
      
     
     
      k
     
    
    
     
      k
     
     
      
       −
      
      
       
        1
       
       
        2
       
      
     
    
    
     ⋅
    
    
     
      e
     
     
      i
     
    
   
   
    z:=\sum_{i=1}^{k} k^{-\frac{1}{2}} \cdot e_{i}
   
  
 z:=∑i=1k​k−21​⋅ei​,并且
 
  
   
    
     S
    
   
   
    S
   
  
 S为旋转矩阵,所以有
  
   
    
     
      S
     
     
      z
     
     
      =
     
     
      ∥
     
     
      z
     
     
      
       ∥
      
      
       2
      
     
     
      
       e
      
      
       1
      
     
     
      =
     
     
      
       e
      
      
       1
      
     
    
    
     S z=\|z\|_{2} e_{1}= e_{1}
    
   
  Sz=∥z∥2​e1​=e1​

易知,矩阵

     Q
    
    
     :
    
    
     =
    
    
     
      S
     
     
      ⊤
     
    
    
     R
    
   
   
    Q:=S^{\top} R
   
  
 Q:=S⊤R为旋转矩阵,其满足
  
   
    
     
      Q
     
     
      g
     
     
      =
     
     
      
       S
      
      
       ⊤
      
     
     
      R
     
     
      g
     
     
      =
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
     
     
      
       S
      
      
       ⊤
      
     
     
      
       e
      
      
       1
      
     
     
      =
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
     
     
      z
     
    
    
     Q g= S^{\top} R g = \|g\|_{2} S^{\top} e_1 = \|g\|_{2} z
    
   
  Qg=S⊤Rg=∥g∥2​S⊤e1​=∥g∥2​z

令向量

      r
     
     
      i
     
    
    
     :
    
    
     =
    
    
     
      Q
     
     
      ⊤
     
    
    
     
      e
     
     
      i
     
    
   
   
    r_{i}:=Q^{\top} e_{i}
   
  
 ri​:=Q⊤ei​,并且
 
  
   
    
     1
    
    
     ≤
    
    
     i
    
    
     ≤
    
    
     k
    
   
   
    1 \leq i \leq k
   
  
 1≤i≤k ,其中
 
  
   
    
     
      r
     
     
      i
     
    
   
   
    r_i
   
  
 ri​是矩阵
 
  
   
    
     Q
    
   
   
    Q
   
  
 Q的第
 
  
   
    
     i
    
   
   
    i
   
  
 i列,
 
  
   
    
     Q
    
   
   
    Q
   
  
 Q是正交矩阵,进而可知:
  
   
    
     
      
       g
      
      
       ⊤
      
     
     
      
       r
      
      
       i
      
     
     
      =
     
     
      (
     
     
      Q
     
     
      g
     
     
      
       )
      
      
       ⊤
      
     
     
      
       e
      
      
       i
      
     
     
      =
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
     
     
      ⋅
     
     
      
       z
      
      
       ⊤
      
     
     
      
       e
      
      
       i
      
     
     
      =
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
     
     
      ⋅
     
     
      
       k
      
      
       
        −
       
       
        
         1
        
        
         2
        
       
      
     
     
      ≥
     
     
      ∥
     
     
      g
     
     
      
       ∥
      
      
       2
      
     
     
      ⋅
     
     
      α
     
    
    
      g^{\top} r_{i}=(Qg)^{\top}e_{i} = \|g\|_{2} \cdot z^{\top} e_{i}=\|g\|_{2} \cdot k^{-\frac{1}{2}} \geq\|g\|_{2} \cdot \alpha
    
   
  g⊤ri​=(Qg)⊤ei​=∥g∥2​⋅z⊤ei​=∥g∥2​⋅k−21​≥∥g∥2​⋅α

证毕!

通过以上的证明可以得到一个非常严谨漂亮的结论,即对抗子空间的维度

     k
    
   
   
    k
   
  
 k大小与损失函数增长程度
 
  
   
    
     α
    
   
   
    \alpha
   
  
 α的平方成反比,这也是很符合直观理解。增长程度越大,对抗子空间就越往梯度方向坍缩,因为梯度方向是最速方向。

多模型对抗子空间维数

在黑盒模型中,经常会利用到对抗样本的可迁移性进行攻击,即利用模型

      f
     
     
      θ
     
    
   
   
    f_{\theta}
   
  
 fθ​生成的对抗样本
 
  
   
    
     
      x
     
     
      ′
     
    
   
   
    x^{\prime}
   
  
 x′,迁移未知分类模型
 
  
   
    
     
      g
     
     
      η
     
    
   
   
    g_\eta
   
  
 gη​中进行攻击,其主要原因在于针对两个不同的模型有重叠的对抗子空间,所以才会使得对抗样本有攻击的可迁移性。假定
 
  
   
    
     r
    
   
   
    r
   
  
 r表示的是样本
 
  
   
    
     x
    
   
   
    x
   
  
 x针对模型
 
  
   
    
     
      f
     
     
      θ
     
    
   
   
    f_\theta
   
  
 fθ​的使得其损失函数增长
 
  
   
    
     α
    
   
   
    \alpha
   
  
 α的对抗扰动;
 
  
   
    
     s
    
   
   
    s
   
  
 s表示的是样本
 
  
   
    
     x
    
   
   
    x
   
  
 x针对模型
 
  
   
    
     
      g
     
     
      η
     
    
   
   
    g_\eta
   
  
 gη​的使得其损失函数增长
 
  
   
    
     α
    
   
   
    \alpha
   
  
 α的对抗扰动。其中
 
  
   
    
     r
    
    
     ∈
    
    
     
      S
     
     
      p
     
     
      a
     
     
      n
     
    
    
     {
    
    
     
      r
     
     
      1
     
    
    
     ,
    
    
     
      r
     
     
      2
     
    
    
     ⋯
     
    
     ,
    
    
     
      r
     
     
      k
     
    
    
     }
    
   
   
    r \in \mathrm{Span}\{r_1,r_2\cdots,r_k\}
   
  
 r∈Span{r1​,r2​⋯,rk​},即扰动
 
  
   
    
     r
    
   
   
    r
   
  
 r属于
 
  
   
    
     
      r
     
     
      1
     
    
    
     ,
    
    
     
      r
     
     
      2
     
    
    
     ,
    
    
     ⋯
     
    
     ,
    
    
     
      r
     
     
      k
     
    
   
   
    r_1,r_2,\cdots,r_k
   
  
 r1​,r2​,⋯,rk​这
 
  
   
    
     k
    
   
   
    k
   
  
 k个正交向量组成的对抗子空间中。其中
 
  
   
    
     s
    
    
     ∈
    
    
     
      S
     
     
      p
     
     
      a
     
     
      n
     
    
    
     {
    
    
     
      s
     
     
      1
     
    
    
     ,
    
    
     
      s
     
     
      2
     
    
    
     ⋯
     
    
     ,
    
    
     
      s
     
     
      l
     
    
    
     }
    
   
   
    s \in \mathrm{Span}\{s_1,s_2\cdots,s_l\}
   
  
 s∈Span{s1​,s2​⋯,sl​},即扰动
 
  
   
    
     s
    
   
   
    s
   
  
 s属于
 
  
   
    
     
      s
     
     
      1
     
    
    
     ,
    
    
     
      s
     
     
      2
     
    
    
     ,
    
    
     ⋯
     
    
     ,
    
    
     
      s
     
     
      l
     
    
   
   
    s_1,s_2,\cdots,s_l
   
  
 s1​,s2​,⋯,sl​这
 
  
   
    
     l
    
   
   
    l
   
  
 l个正交向量组成的对抗子空间中;则此时针对多个模型对抗子空间维度的大小为
  
   
    
     
      q
     
     
      =
     
     
      
       d
      
      
       i
      
      
       m
      
     
     
      {
     
     
      
       S
      
      
       p
      
      
       a
      
      
       n
      
     
     
      {
     
     
      
       r
      
      
       1
      
     
     
      ,
     
     
      
       r
      
      
       2
      
     
     
      ,
     
     
      ⋯
      
     
      ,
     
     
      
       r
      
      
       k
      
     
     
      }
     
     
      ⋂
     
     
      
       S
      
      
       p
      
      
       a
      
      
       n
      
     
     
      {
     
     
      
       s
      
      
       1
      
     
     
      ,
     
     
      
       s
      
      
       2
      
     
     
      ,
     
     
      ⋯
      
     
      ,
     
     
      
       s
      
      
       l
      
     
     
      }
     
     
      }
     
    
    
     q=\mathrm{dim}\{\mathrm{Span}\{r_1,r_2,\cdots,r_k\}\bigcap\mathrm{Span}\{s_1,s_2,\cdots,s_l\}\}
    
   
  q=dim{Span{r1​,r2​,⋯,rk​}⋂Span{s1​,s2​,⋯,sl​}}同理根据以上推导思路可以求出3个模型以上重叠的对抗子空间的维度。
标签: 深度学习

本文转载自: https://blog.csdn.net/qq_38406029/article/details/122767732
版权归原作者 鬼道2022 所有, 如有侵权,请联系我们删除。

“对抗子空间维度探讨”的评论:

还没有评论