0


对抗子空间维度探讨

引言

对抗样本是深度学习模型的主要威胁之一,对抗样本会使得目标分类器模型分类出错并且它存在于稠密的对抗子空间中,对抗子空间又包含于特定的样本空间中。本文主要是对对抗子空间维数进行探讨,即针对于单个模型的特定样本对抗子空间的维度是多少,针对多个模型的特定样本对抗子空间的维度是多少。

对抗子空间

给定干净样本

  1. x
  2. R
  3. d
  4. x\in \mathbb{R}^d
  5. xRd,以及其对应的标签
  6. y
  7. y
  8. y,带有参数
  9. θ
  10. \theta
  11. θ的神经网络分类器为
  12. f
  13. θ
  14. (
  15. )
  16. f_\theta(\cdot)
  17. fθ​(⋅),损失函数为
  18. J
  19. (
  20. x
  21. ,
  22. y
  23. ;
  24. θ
  25. )
  26. J(x,y;\theta)
  27. J(x,y;θ),对抗样本为
  28. x
  29. x^{\prime}
  30. x′,则根据多元泰勒展开式可得
  31. J
  32. (
  33. x
  34. ,
  35. y
  36. ;
  37. θ
  38. )
  39. =
  40. J
  41. (
  42. x
  43. ,
  44. y
  45. ;
  46. θ
  47. )
  48. +
  49. (
  50. x
  51. x
  52. )
  53. x
  54. J
  55. (
  56. x
  57. ,
  58. y
  59. ;
  60. θ
  61. )
  62. +
  63. O
  64. (
  65. x
  66. x
  67. 2
  68. )
  69. J(x^{\prime},y;\theta)=J(x,y;\theta)+(x^{\prime}-x)^{\top}\nabla_x J(x,y;\theta)+O(\|x^{\prime}-x\|^2)
  70. J(x′,y;θ)=J(x,y;θ)+(x′−x)⊤∇xJ(x,y;θ)+O(∥x′−x2)进一步可得优化目标为
  71. m
  72. a
  73. x
  74. i
  75. m
  76. i
  77. z
  78. e
  79. J
  80. (
  81. x
  82. ,
  83. y
  84. ;
  85. θ
  86. )
  87. +
  88. (
  89. x
  90. x
  91. )
  92. x
  93. J
  94. (
  95. x
  96. ,
  97. y
  98. ;
  99. θ
  100. )
  101. s
  102. u
  103. b
  104. j
  105. e
  106. c
  107. t
  108. t
  109. o
  110. x
  111. x
  112. ε
  113. \begin{array}{rl}\mathrm{maximize}& J(x,y;\theta)+(x^{\prime}-x)^{\top}\nabla_x J(x,y;\theta)\\\mathrm{subject \text{ }to}& \|x^{\prime}-x\|_{\infty} \le \varepsilon\end{array}
  114. maximizesubject toJ(x,y;θ)+(x′−x)⊤∇xJ(x,y;θ)∥x′−x∥∞​≤ε​进而可得对抗样本的计算公式为
  115. x
  116. =
  117. x
  118. +
  119. ε
  120. x
  121. J
  122. (
  123. x
  124. ,
  125. y
  126. ;
  127. θ
  128. )
  129. x^{\prime}=x+\varepsilon \cdot\nabla_x J(x,y;\theta)
  130. x′=x+ε⋅∇xJ(x,y;θ)其中
  131. ε
  132. \varepsilon
  133. ε表示的是对抗扰动的大小。由上公式可知,干净样本
  134. x
  135. x
  136. x沿着梯度方向
  137. x
  138. J
  139. (
  140. x
  141. ,
  142. y
  143. ;
  144. θ
  145. )
  146. \nabla_x J(x,y;\theta)
  147. xJ(x,y;θ)可以进入到对抗子空间中。进一步详细的阐述如下图所示,其中图(a),(b)和(c)表示的是给定一个干净样本沿着不同的方向生成的样本输入到分类器分类的结果示意图,每个方格表示每一个样本的分类结果,方格中白色表示分类器分类正确,彩色表示分类器分类成其它不同的类别。图(d ,(e)和(f)表示样本移动的方向分解示意图。

在这里插入图片描述
由上图(d)可知,如果选择两个正交方向,一个是对抗扰动的梯度方向,另一个是随机扰动方向,从图(a)可知,沿着对抗扰动方向的干净样本可以进入到对抗子空间中,沿着随机扰动的方向则没有生成对抗样本。由上图(e)可知,如果这两个正交方向与梯度方向成一个角度,则从图(b)可知这两个正交方向都可以进入到对抗子空间中,但是却不是最速方向。由上图(f)可知,如果这两个正交方向是都是随机扰动,从图(c)可知,干净样本都很难进入到对抗子空间中去,该图出现误分类的情况与对抗样本无关,跟模型自身的训练情况有关。

单模型对抗子空间维数

由上一节对对抗样本损失函数的多元泰勒展开可以近似有

  1. J
  2. (
  3. x
  4. ,
  5. y
  6. ;
  7. θ
  8. )
  9. J
  10. (
  11. x
  12. ,
  13. y
  14. ;
  15. θ
  16. )
  17. +
  18. (
  19. x
  20. x
  21. )
  22. x
  23. J
  24. (
  25. x
  26. ,
  27. y
  28. ;
  29. θ
  30. )
  31. J(x^{\prime},y;\theta)\approx J(x,y';\theta)+(x^{\prime}-x)^{\top} \nabla_x J(x,y;\theta)
  32. J(x′,y;θ)≈J(x,y′;θ)+(x′−x)⊤∇x​J(x,y;θ)其中令
  33. g
  34. =
  35. x
  36. J
  37. (
  38. x
  39. ,
  40. y
  41. ;
  42. θ
  43. )
  44. R
  45. d
  46. g = \nabla_x J(x,y;\theta)\in \mathbb{R}^d
  47. g=∇x​J(x,y;θ)∈Rd,
  48. r
  49. =
  50. (
  51. x
  52. x
  53. )
  54. R
  55. d
  56. r = (x^{\prime}-x)\in \mathbb{R}^d
  57. r=(x′−x)∈Rd。目的是要探究给定一个模型,求解对抗扰动
  58. r
  59. r
  60. r使得模型损失函数至少增长
  61. α
  62. \alpha
  63. α得对抗子空间维度的问题,数学表述为
  64. J
  65. (
  66. x
  67. ,
  68. y
  69. ;
  70. θ
  71. )
  72. J
  73. (
  74. x
  75. ,
  76. y
  77. ;
  78. θ
  79. )
  80. =
  81. r
  82. g
  83. α
  84. \begin{aligned}J(x^{\prime},y;\theta)-J(x,y;\theta)&=r^{\top} g\ge \alpha\\\end{aligned}
  85. J(x′,y;θ)−J(x,y;θ)​=r⊤g≥α​其中
  86. r
  87. S
  88. p
  89. a
  90. n
  91. {
  92. r
  93. 1
  94. ,
  95. r
  96. 2
  97. ,
  98. r
  99. k
  100. }
  101. r \in \mathrm{Span}\{r_1,r_2\cdots,r_k\}
  102. r∈Span{r1​,r2​⋯,rk​},即扰动
  103. r
  104. r
  105. r属于
  106. r
  107. 1
  108. ,
  109. r
  110. 2
  111. ,
  112. ,
  113. r
  114. k
  115. r_1,r_2,\cdots,r_k
  116. r1​,r2​,⋯,rk​这
  117. k
  118. k
  119. k个正交向量组成的对抗子空间中,
  120. k
  121. k
  122. k就是对抗子空间的维度。此时有如下定理成立,详细证明过程如下所示:

定理: 给定

  1. g
  2. R
  3. d
  4. g \in \mathbb{R}^{d}
  5. gRd
  6. α
  7. [
  8. 0
  9. ,
  10. 1
  11. ]
  12. \alpha \in[0,1]
  13. α∈[0,1],最大对抗子空间维数
  14. k
  15. k
  16. k的正交向量
  17. r
  18. 1
  19. ,
  20. r
  21. 2
  22. ,
  23. ,
  24. r
  25. k
  26. r_1,r_2,\ldots,r_k
  27. r1​,r2​,…,rk 满足
  28. r
  29. i
  30. 2
  31. 1
  32. \left\|r_{i}\right\|_{2} \leq 1
  33. ri​∥2​≤1
  34. g
  35. r
  36. i
  37. α
  38. g
  39. 2
  40. g^{\top} r_{i} \geq \alpha \cdot\|g\|_{2}
  41. gri​≥α⋅∥g2​的充要条件是
  42. k
  43. =
  44. min
  45. {
  46. 1
  47. α
  48. 2
  49. ,
  50. d
  51. }
  52. k=\min \left\{\left\lfloor\frac{1}{\alpha^{2}}\right\rfloor, d\right\}
  53. k=min{⌊α21​⌋,d}。

证明:
必要性证明: 已知

  1. g
  2. R
  3. d
  4. g \in \mathbb{R}^{d}
  5. gRd
  6. α
  7. [
  8. 0
  9. ,
  10. 1
  11. ]
  12. \alpha \in[0,1]
  13. α∈[0,1],令
  14. r
  15. ^
  16. i
  17. :
  18. =
  19. r
  20. i
  21. r
  22. i
  23. 2
  24. \hat{r}_{i}:=\frac{r_{i}}{\left\|r_{i}\right\|_{2}}
  25. r^i​:=∥ri​∥2ri​​,并且
  26. r
  27. 1
  28. ,
  29. r
  30. 2
  31. ,
  32. ,
  33. r
  34. k
  35. r_{1}, r_{2}, \ldots, r_{k}
  36. r1​,r2​,…,rk​是正交的,由此可知
  37. k
  38. d
  39. k \leq d
  40. kd

(1)如果

  1. k
  2. =
  3. d
  4. k = d
  5. k=d,则由向量乘积公式可知:
  6. i
  7. =
  8. 1
  9. k
  10. g
  11. r
  12. ^
  13. i
  14. 2
  15. =
  16. i
  17. =
  18. 1
  19. d
  20. g
  21. r
  22. ^
  23. i
  24. 2
  25. =
  26. i
  27. =
  28. 1
  29. d
  30. g
  31. 2
  32. 2
  33. r
  34. ^
  35. i
  36. 2
  37. 2
  38. cos
  39. 2
  40. α
  41. i
  42. \sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2}=\sum_{i=1}^{d}\left|g^{\top} \hat{r}_{i}\right|^{2} = \sum_{i=1}^{d} \|g\|_{2}^{2} \|\hat{r}_{i}\|_{2}^{2} \cos^{2} \alpha_{i}
  43. i=1k​∣∣​gr^i​∣∣​2=i=1d​∣∣​gr^i​∣∣​2=i=1d​∥g22​∥r^i​∥22cos2αi​其中,
  44. cos
  45. α
  46. i
  47. \cos \alpha_{i}
  48. cosαi 表示的是向量
  49. g
  50. g
  51. g
  52. r
  53. ^
  54. i
  55. \hat{r}_{i}
  56. r^i​的余弦值,并且又知道
  57. r
  58. ^
  59. i
  60. 2
  61. 2
  62. =
  63. 1
  64. \|\hat{r}_{i}\|_{2}^{2}=1
  65. r^i​∥22​=1,所以有
  66. i
  67. =
  68. 1
  69. d
  70. g
  71. 2
  72. 2
  73. r
  74. ^
  75. i
  76. 2
  77. 2
  78. cos
  79. 2
  80. α
  81. i
  82. =
  83. g
  84. 2
  85. 2
  86. i
  87. =
  88. 1
  89. d
  90. cos
  91. 2
  92. α
  93. i
  94. =
  95. g
  96. 2
  97. 2
  98. \sum_{i=1}^{d} \|g\|_{2}^{2} \|\hat{r}_{i}\|_{2}^{2} \cos^{2} \alpha_{i} = \|g\|_{2}^{2} \sum_{i=1}^{d} \cos^{2} \alpha_{i} = \|g\|_{2}^{2}
  99. i=1d​∥g22​∥r^i​∥22cos2αi​=∥g22i=1dcos2αi​=∥g22​进而则有
  100. i
  101. =
  102. 1
  103. k
  104. g
  105. r
  106. ^
  107. i
  108. 2
  109. =
  110. g
  111. 2
  112. 2
  113. \sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2} = \|g\|_{2}^{2}
  114. i=1k​∣∣​gr^i​∣∣​2=∥g22

(2)如果

  1. k
  2. <
  3. d
  4. k < d
  5. k<d,则先对
  6. r
  7. 1
  8. ,
  9. r
  10. 2
  11. ,
  12. ,
  13. r
  14. k
  15. r_{1}, r_{2}, \ldots, r_{k}
  16. r1​,r2​,…,rk​进行正交扩充,扩充为
  17. r
  18. 1
  19. ,
  20. r
  21. 2
  22. ,
  23. ,
  24. r
  25. k
  26. ,
  27. r
  28. k
  29. +
  30. 1
  31. ,
  32. ,
  33. r
  34. d
  35. r_{1}, r_{2}, \ldots, r_{k}, r_{k+1},\ldots, r_{d}
  36. r1​,r2​,…,rk​,rk+1​,…,rd​则可知
  37. i
  38. =
  39. 1
  40. k
  41. g
  42. r
  43. ^
  44. i
  45. 2
  46. <
  47. i
  48. =
  49. 1
  50. d
  51. g
  52. r
  53. ^
  54. i
  55. 2
  56. =
  57. i
  58. =
  59. 1
  60. d
  61. g
  62. 2
  63. 2
  64. r
  65. ^
  66. i
  67. 2
  68. 2
  69. cos
  70. 2
  71. α
  72. i
  73. =
  74. g
  75. 2
  76. 2
  77. \sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2}< \sum_{i=1}^{d}\left|g^{\top} \hat{r}_{i}\right|^{2} = \sum_{i=1}^{d} \|g\|_{2}^{2} \|\hat{r}_{i}\|_{2}^{2} \cos^{2} \alpha_{i} = \|g\|_{2}^{2}
  78. i=1k​∣∣​gr^i​∣∣​2<i=1d​∣∣​gr^i​∣∣​2=i=1d​∥g22​∥r^i​∥22cos2αi​=∥g22​进而可知
  79. g
  80. 2
  81. 2
  82. i
  83. =
  84. 1
  85. k
  86. g
  87. r
  88. ^
  89. i
  90. 2
  91. \|g\|_{2}^{2} \geq \sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2}
  92. g22​≥i=1k​∣∣​gr^i​∣∣​2又因为
  93. r
  94. ^
  95. i
  96. :
  97. =
  98. r
  99. i
  100. r
  101. i
  102. 2
  103. \hat{r}_{i}:=\frac{r_{i}}{\left\|r_{i}\right\|_{2}}
  104. r^i​:=∥ri​∥2ri​​,所以有
  105. i
  106. =
  107. 1
  108. k
  109. g
  110. r
  111. ^
  112. i
  113. 2
  114. =
  115. i
  116. =
  117. 1
  118. k
  119. g
  120. r
  121. i
  122. r
  123. i
  124. 2
  125. 2
  126. i
  127. =
  128. 1
  129. k
  130. g
  131. r
  132. i
  133. 2
  134. r
  135. i
  136. 2
  137. 2
  138. \sum_{i=1}^{k}\left|g^{\top} \hat{r}_{i}\right|^{2} = \sum_{i=1}^{k}\left|g^{\top} \frac{r_{i}}{\left\|r_{i}\right\|_{2}} \right|^{2} \geq \sum_{i=1}^{k} \frac{\left|g^{\top} r_{i}\right|^{2}}{\left\|r_{i}\right\|_{2}^{2}}
  139. i=1k​∣∣​gr^i​∣∣​2=i=1k​∣∣∣∣​g⊤∥ri​∥2ri​​∣∣∣∣​2i=1k​∥ri​∥22​∣∣​gri​∣∣​2

因为

  1. g
  2. r
  3. i
  4. α
  5. g
  6. 2
  7. g^{\top} r_{i} \geq \alpha \cdot\|g\|_{2}
  8. gri​≥α⋅∥g2​,
  9. r
  10. i
  11. 2
  12. 1
  13. \left\|r_{i}\right\|_{2} \leq 1
  14. ri​∥2​≤1,所以有
  15. i
  16. =
  17. 1
  18. k
  19. g
  20. r
  21. i
  22. 2
  23. r
  24. i
  25. 2
  26. 2
  27. k
  28. α
  29. 2
  30. g
  31. 2
  32. 2
  33. \sum_{i=1}^{k} \frac{\left|g^{\top} r_{i}\right|^{2}}{\left\|r_{i}\right\|_{2}^{2}} \geq k \cdot \alpha^{2} \cdot\|g\|_{2}^{2}
  34. i=1k​∥ri​∥22​∣∣​gri​∣∣​2​≥k⋅α2⋅∥g22​又因为
  35. k
  36. 1
  37. α
  38. 2
  39. k \leq \left\lfloor\frac{1}{\alpha^{2}}\right\rfloor
  40. k≤⌊α21​⌋

最终有

  1. max
  2. {
  3. k
  4. }
  5. =
  6. min
  7. {
  8. 1
  9. α
  10. 2
  11. ,
  12. d
  13. }
  14. \max\{k\} = \min\{ \left\lfloor\frac{1}{\alpha^{2}}\right\rfloor,d\}
  15. max{k}=min{⌊α21​⌋,d}

充分性证明: 已知

  1. k
  2. =
  3. min
  4. {
  5. 1
  6. α
  7. 2
  8. ,
  9. d
  10. }
  11. k=\min \left\{\left\lfloor\frac{1}{\alpha^{2}}\right\rfloor, d\right\}
  12. k=min{⌊α21​⌋,d},令
  13. e
  14. 1
  15. ,
  16. e
  17. 2
  18. ,
  19. ,
  20. e
  21. d
  22. e_{1}, e_{2}, \dots, e_{d}
  23. e1​,e2​,…,ed​表示的是
  24. R
  25. d
  26. \mathbb{R}_{d}
  27. Rd​的基向量,
  28. R
  29. R
  30. R为旋转矩阵并且有
  31. R
  32. g
  33. =
  34. g
  35. 2
  36. e
  37. 1
  38. R g=\|g\|_{2} \cdot e_{1}
  39. Rg=∥g2​⋅e1​。
  40. z
  41. :
  42. =
  43. i
  44. =
  45. 1
  46. k
  47. k
  48. 1
  49. 2
  50. e
  51. i
  52. z:=\sum_{i=1}^{k} k^{-\frac{1}{2}} \cdot e_{i}
  53. z:=∑i=1kk21​⋅ei​,并且
  54. S
  55. S
  56. S为旋转矩阵,所以有
  57. S
  58. z
  59. =
  60. z
  61. 2
  62. e
  63. 1
  64. =
  65. e
  66. 1
  67. S z=\|z\|_{2} e_{1}= e_{1}
  68. Sz=∥z2e1​=e1

易知,矩阵

  1. Q
  2. :
  3. =
  4. S
  5. R
  6. Q:=S^{\top} R
  7. Q:=SR为旋转矩阵,其满足
  8. Q
  9. g
  10. =
  11. S
  12. R
  13. g
  14. =
  15. g
  16. 2
  17. S
  18. e
  19. 1
  20. =
  21. g
  22. 2
  23. z
  24. Q g= S^{\top} R g = \|g\|_{2} S^{\top} e_1 = \|g\|_{2} z
  25. Qg=SRg=∥g2Se1​=∥g2z

令向量

  1. r
  2. i
  3. :
  4. =
  5. Q
  6. e
  7. i
  8. r_{i}:=Q^{\top} e_{i}
  9. ri​:=Qei​,并且
  10. 1
  11. i
  12. k
  13. 1 \leq i \leq k
  14. 1ik ,其中
  15. r
  16. i
  17. r_i
  18. ri​是矩阵
  19. Q
  20. Q
  21. Q的第
  22. i
  23. i
  24. i列,
  25. Q
  26. Q
  27. Q是正交矩阵,进而可知:
  28. g
  29. r
  30. i
  31. =
  32. (
  33. Q
  34. g
  35. )
  36. e
  37. i
  38. =
  39. g
  40. 2
  41. z
  42. e
  43. i
  44. =
  45. g
  46. 2
  47. k
  48. 1
  49. 2
  50. g
  51. 2
  52. α
  53. g^{\top} r_{i}=(Qg)^{\top}e_{i} = \|g\|_{2} \cdot z^{\top} e_{i}=\|g\|_{2} \cdot k^{-\frac{1}{2}} \geq\|g\|_{2} \cdot \alpha
  54. gri​=(Qg)⊤ei​=∥g2​⋅zei​=∥g2​⋅k21​≥∥g2​⋅α

证毕!

通过以上的证明可以得到一个非常严谨漂亮的结论,即对抗子空间的维度

  1. k
  2. k
  3. k大小与损失函数增长程度
  4. α
  5. \alpha
  6. α的平方成反比,这也是很符合直观理解。增长程度越大,对抗子空间就越往梯度方向坍缩,因为梯度方向是最速方向。

多模型对抗子空间维数

在黑盒模型中,经常会利用到对抗样本的可迁移性进行攻击,即利用模型

  1. f
  2. θ
  3. f_{\theta}
  4. fθ​生成的对抗样本
  5. x
  6. x^{\prime}
  7. x′,迁移未知分类模型
  8. g
  9. η
  10. g_\eta
  11. gη​中进行攻击,其主要原因在于针对两个不同的模型有重叠的对抗子空间,所以才会使得对抗样本有攻击的可迁移性。假定
  12. r
  13. r
  14. r表示的是样本
  15. x
  16. x
  17. x针对模型
  18. f
  19. θ
  20. f_\theta
  21. fθ​的使得其损失函数增长
  22. α
  23. \alpha
  24. α的对抗扰动;
  25. s
  26. s
  27. s表示的是样本
  28. x
  29. x
  30. x针对模型
  31. g
  32. η
  33. g_\eta
  34. gη​的使得其损失函数增长
  35. α
  36. \alpha
  37. α的对抗扰动。其中
  38. r
  39. S
  40. p
  41. a
  42. n
  43. {
  44. r
  45. 1
  46. ,
  47. r
  48. 2
  49. ,
  50. r
  51. k
  52. }
  53. r \in \mathrm{Span}\{r_1,r_2\cdots,r_k\}
  54. rSpan{r1​,r2​⋯,rk​},即扰动
  55. r
  56. r
  57. r属于
  58. r
  59. 1
  60. ,
  61. r
  62. 2
  63. ,
  64. ,
  65. r
  66. k
  67. r_1,r_2,\cdots,r_k
  68. r1​,r2​,⋯,rk​这
  69. k
  70. k
  71. k个正交向量组成的对抗子空间中。其中
  72. s
  73. S
  74. p
  75. a
  76. n
  77. {
  78. s
  79. 1
  80. ,
  81. s
  82. 2
  83. ,
  84. s
  85. l
  86. }
  87. s \in \mathrm{Span}\{s_1,s_2\cdots,s_l\}
  88. sSpan{s1​,s2​⋯,sl​},即扰动
  89. s
  90. s
  91. s属于
  92. s
  93. 1
  94. ,
  95. s
  96. 2
  97. ,
  98. ,
  99. s
  100. l
  101. s_1,s_2,\cdots,s_l
  102. s1​,s2​,⋯,sl​这
  103. l
  104. l
  105. l个正交向量组成的对抗子空间中;则此时针对多个模型对抗子空间维度的大小为
  106. q
  107. =
  108. d
  109. i
  110. m
  111. {
  112. S
  113. p
  114. a
  115. n
  116. {
  117. r
  118. 1
  119. ,
  120. r
  121. 2
  122. ,
  123. ,
  124. r
  125. k
  126. }
  127. S
  128. p
  129. a
  130. n
  131. {
  132. s
  133. 1
  134. ,
  135. s
  136. 2
  137. ,
  138. ,
  139. s
  140. l
  141. }
  142. }
  143. q=\mathrm{dim}\{\mathrm{Span}\{r_1,r_2,\cdots,r_k\}\bigcap\mathrm{Span}\{s_1,s_2,\cdots,s_l\}\}
  144. q=dim{Span{r1​,r2​,⋯,rk​}⋂Span{s1​,s2​,⋯,sl​}}同理根据以上推导思路可以求出3个模型以上重叠的对抗子空间的维度。
标签: 深度学习

本文转载自: https://blog.csdn.net/qq_38406029/article/details/122767732
版权归原作者 鬼道2022 所有, 如有侵权,请联系我们删除。

“对抗子空间维度探讨”的评论:

还没有评论