0


Jensen不等式

引言

概率不等式是概率论和数理统计的理论研究中的重要工具,对于概率极限理论和统计大样本理论,几乎所有重要结果的论证是借助于概率不等式的巧妙应用,

  1. J
  2. e
  3. n
  4. s
  5. e
  6. n
  7. \mathrm{Jensen}
  8. Jensen不等式和证明,并应用其带来解决一些相关问题。

  1. J
  2. e
  3. n
  4. s
  5. e
  6. n
  7. \mathrm{Jensen}
  8. Jensen不等式不同形式
  9. J
  10. e
  11. n
  12. s
  13. e
  14. n
  15. \mathrm{Jensen}
  16. Jensen不等式的形式有很多种,标准形式的如下:

**

  1. J
  2. e
  3. n
  4. s
  5. e
  6. n
  7. \mathrm{Jensen}
  8. Jensen不等式:** 如果
  9. f
  10. (
  11. x
  12. )
  13. f(x)
  14. f(x)为连续实值凸函数,且
  15. x
  16. 1
  17. x
  18. 2
  19. x
  20. n
  21. x_1\le x_2\le \cdots \le x_n
  22. x1​≤x2​≤⋯≤xn​,
  23. i
  24. =
  25. 1
  26. n
  27. λ
  28. i
  29. =
  30. 1
  31. \sum\limits_{i=1}^n\lambda_i=1
  32. i=1n​λi​=1
  33. λ
  34. i
  35. 0
  36. \lambda_i \ge0
  37. λi​≥0
  38. i
  39. =
  40. 1
  41. ,
  42. 2
  43. ,
  44. n
  45. i=1,2\cdots,n
  46. i=1,2⋯,n,则有
  47. i
  48. =
  49. 1
  50. n
  51. λ
  52. i
  53. f
  54. (
  55. x
  56. i
  57. )
  58. f
  59. (
  60. i
  61. =
  62. 1
  63. n
  64. λ
  65. i
  66. x
  67. i
  68. )
  69. \sum\limits_{i=1}^n\lambda_i f(x_i)\ge f(\sum\limits_{i=1}^n\lambda_i x_i)
  70. i=1n​λif(xi​)≥f(i=1n​λixi​)如果
  71. f
  72. (
  73. x
  74. )
  75. f(x)
  76. f(x)为连续实值凹函数,则有
  77. i
  78. =
  79. 1
  80. n
  81. λ
  82. i
  83. f
  84. (
  85. x
  86. i
  87. )
  88. f
  89. (
  90. i
  91. =
  92. 1
  93. n
  94. λ
  95. i
  96. x
  97. i
  98. )
  99. \sum\limits_{i=1}^n\lambda_i f(x_i)\le f(\sum\limits_{i=1}^n\lambda_i x_i)
  100. i=1n​λif(xi​)≤f(i=1n​λixi​)

在概率论中

  1. J
  2. e
  3. n
  4. s
  5. e
  6. n
  7. \mathrm{Jensen}
  8. Jensen不等式有:离散型,连续型,条件期望型和中位数型等形式

**

  1. J
  2. e
  3. n
  4. s
  5. e
  6. n
  7. \mathrm{Jensen}
  8. Jensen不等式1:**
  9. f
  10. (
  11. x
  12. )
  13. f(x)
  14. f(x)是区间
  15. [
  16. a
  17. ,
  18. b
  19. ]
  20. [a,b]
  21. [a,b]上的凸函数,
  22. X
  23. X
  24. X是取值于
  25. [
  26. a
  27. ,
  28. b
  29. ]
  30. [a,b]
  31. [a,b]上子集
  32. A
  33. A
  34. A的离散型随机变量,则有如下两个结论成立

(1)

  1. E
  2. (
  3. f
  4. (
  5. X
  6. )
  7. )
  8. f
  9. (
  10. E
  11. (
  12. X
  13. )
  14. )
  15. \mathbb{E}(f(X))\ge f(\mathbb{E}(X))
  16. E(f(X))≥f(E(X));

(2)如果

  1. f
  2. (
  3. X
  4. )
  5. f(X)
  6. f(X)是严格凸的,则不等式中等号当且仅当
  7. P
  8. (
  9. X
  10. =
  11. E
  12. (
  13. X
  14. )
  15. )
  16. =
  17. 1
  18. P(X=\mathbb{E}(X))=1
  19. P(X=E(X))=1时成立。

证明:
(1)对

  1. X
  2. X
  3. X取值的个数进行数学归纳法证明,首先对于两点分布:
  4. X
  5. {
  6. p
  7. (
  8. x
  9. 1
  10. )
  11. ,
  12. p
  13. (
  14. x
  15. 2
  16. )
  17. }
  18. X \sim \{p(x_1),p(x_2)\}
  19. X∼{p(x1​),p(x2​)}简记
  20. p
  21. 1
  22. =
  23. p
  24. (
  25. x
  26. 1
  27. )
  28. p_1=p(x_1)
  29. p1​=p(x1​),
  30. p
  31. 2
  32. =
  33. p
  34. (
  35. x
  36. 2
  37. )
  38. p_2=p(x_2)
  39. p2​=p(x2​)。注意到
  40. p
  41. 1
  42. =
  43. 1
  44. p
  45. 2
  46. p_1=1-p_2
  47. p1​=1p2​,则有
  48. E
  49. (
  50. f
  51. (
  52. X
  53. )
  54. )
  55. =
  56. p
  57. 1
  58. f
  59. (
  60. x
  61. 1
  62. )
  63. +
  64. p
  65. 2
  66. f
  67. (
  68. x
  69. 2
  70. )
  71. f
  72. (
  73. p
  74. 1
  75. x
  76. 1
  77. +
  78. p
  79. 2
  80. x
  81. 2
  82. )
  83. =
  84. f
  85. (
  86. E
  87. (
  88. X
  89. )
  90. )
  91. \mathbb{E}(f(X))=p_1f(x_1)+p_2f(x_2)\ge f(p_1x_1+p_2x_2)=f(\mathbb{E}(X))
  92. E(f(X))=p1f(x1​)+p2f(x2​)≥f(p1x1​+p2x2​)=f(E(X))假设
  93. X
  94. X
  95. X的值域
  96. A
  97. A
  98. A中元素个数为
  99. n
  100. 1
  101. (
  102. n
  103. 2
  104. )
  105. n-1(n \ge 2)
  106. n1(n2),
  107. A
  108. =
  109. {
  110. x
  111. 1
  112. ,
  113. x
  114. 2
  115. ,
  116. ,
  117. x
  118. n
  119. 1
  120. }
  121. A=\{x_1,x_2,\cdots,x_{n-1}\}
  122. A={x1​,x2​,⋯,xn1​}时,结论(1)式成立,则对
  123. A
  124. A
  125. A中元素个数为
  126. n
  127. (
  128. n
  129. 2
  130. )
  131. n(n\ge 2)
  132. n(n2),
  133. A
  134. =
  135. (
  136. x
  137. 1
  138. ,
  139. x
  140. 2
  141. ,
  142. ,
  143. x
  144. n
  145. )
  146. A=(x_1,x_2,\cdots,x_n)
  147. A=(x1​,x2​,⋯,xn​)时,简记
  148. p
  149. i
  150. =
  151. p
  152. (
  153. x
  154. i
  155. )
  156. p_i=p(x_i)
  157. pi​=p(xi​),
  158. p
  159. i
  160. =
  161. p
  162. i
  163. 1
  164. p
  165. n
  166. ,
  167. i
  168. =
  169. 1
  170. ,
  171. 2
  172. ,
  173. ,
  174. n
  175. p_i^{\prime}=\frac{p_i}{1-p_n},i=1,2,\cdots,n
  176. pi′​=1pnpi​​,i=1,2,⋯,n,则有
  177. {
  178. p
  179. 1
  180. ,
  181. p
  182. 2
  183. ,
  184. ,
  185. p
  186. n
  187. 1
  188. }
  189. \{p_1^{\prime},p_2^{\prime},\cdots,p^{\prime}_{n-1}\}
  190. {p1′​,p2′​,⋯,pn1′​}是一个概率分布,从而有
  191. E
  192. (
  193. f
  194. (
  195. X
  196. )
  197. )
  198. =
  199. p
  200. 1
  201. f
  202. (
  203. x
  204. 1
  205. )
  206. +
  207. p
  208. 2
  209. f
  210. (
  211. x
  212. 2
  213. )
  214. +
  215. +
  216. p
  217. n
  218. f
  219. (
  220. x
  221. n
  222. )
  223. =
  224. (
  225. 1
  226. p
  227. n
  228. )
  229. i
  230. =
  231. 1
  232. n
  233. 1
  234. p
  235. i
  236. f
  237. (
  238. x
  239. i
  240. )
  241. +
  242. p
  243. n
  244. f
  245. (
  246. x
  247. n
  248. )
  249. (
  250. 1
  251. p
  252. n
  253. )
  254. f
  255. (
  256. i
  257. =
  258. 1
  259. n
  260. 1
  261. p
  262. i
  263. x
  264. i
  265. )
  266. +
  267. p
  268. n
  269. f
  270. (
  271. x
  272. n
  273. )
  274. f
  275. (
  276. i
  277. =
  278. 1
  279. n
  280. p
  281. i
  282. x
  283. i
  284. )
  285. =
  286. f
  287. (
  288. E
  289. (
  290. X
  291. )
  292. )
  293. \begin{aligned}\mathbb{E}(f(X))&=p_1f(x_1)+p_2f(x_2)+\cdots+p_nf(x_n)\\&=(1-p_n)\sum\limits_{i=1}^{n-1}p^{\prime}_i f(x_i)+p_n f(x_n)\\&\ge(1-p_n)f(\sum\limits_{i=1}^{n-1}p_i^{\prime}x_i)+p_nf(x_n)\\&\ge f(\sum\limits_{i=1}^np_ix_i)=f(\mathbb{E}(X))\end{aligned}
  294. E(f(X))​=p1f(x1​)+p2f(x2​)+⋯+pnf(xn​)=(1pn​)i=1n1pi′​f(xi​)+pnf(xn​)≥(1pn​)f(i=1n1pi′​xi​)+pnf(xn​)≥f(i=1npixi​)=f(E(X))​

(2)若

  1. f
  2. (
  3. x
  4. )
  5. f(x)
  6. f(x)是严格凸的,则总有
  7. E
  8. (
  9. f
  10. (
  11. x
  12. )
  13. )
  14. f
  15. (
  16. E
  17. (
  18. X
  19. )
  20. )
  21. \mathbb{E}(f(x))\ge f(\mathbb{E}(X))
  22. E(f(x))≥f(E(X))成立,除非当且仅当
  23. P
  24. (
  25. X
  26. =
  27. E
  28. (
  29. X
  30. )
  31. )
  32. =
  33. 1
  34. P(X=\mathbb{E}(X))=1
  35. P(X=E(X))=1时,
  36. E
  37. (
  38. f
  39. (
  40. X
  41. )
  42. )
  43. =
  44. f
  45. (
  46. E
  47. (
  48. X
  49. )
  50. )
  51. \mathbb{E}(f(X))=f(\mathbb{E}(X))
  52. E(f(X))=f(E(X))成立。

**

  1. J
  2. e
  3. n
  4. s
  5. e
  6. n
  7. \mathrm{Jensen}
  8. Jensen不等式2:**
  9. X
  10. X
  11. X
  12. m
  13. m
  14. m维随机向量,
  15. f
  16. (
  17. x
  18. )
  19. f(x)
  20. f(x)为定义在
  21. R
  22. m
  23. \mathbb{R}^{m}
  24. Rm上的凸函数
  25. (
  26. m
  27. =
  28. 1
  29. ,
  30. 2
  31. ,
  32. )
  33. (m=1,2,\cdots)
  34. (m=1,2,⋯),其中
  35. E
  36. (
  37. X
  38. )
  39. <
  40. \mathbb{E}(X)<\infty
  41. E(X)<∞,则有

(1)

  1. E
  2. (
  3. f
  4. (
  5. X
  6. )
  7. )
  8. f
  9. (
  10. E
  11. (
  12. X
  13. )
  14. )
  15. \mathbb{E}(f(X))\ge f(\mathbb{E}(X))
  16. E(f(X))≥f(E(X));

(2)如果

  1. f
  2. (
  3. X
  4. )
  5. f(X)
  6. f(X)是严格凸的,则不等式中等号当且仅当
  7. P
  8. (
  9. X
  10. =
  11. E
  12. (
  13. X
  14. )
  15. )
  16. =
  17. 1
  18. P(X=\mathbb{E}(X))=1
  19. P(X=E(X))=1时成立。

证明:
(1)由于

  1. y
  2. =
  3. f
  4. (
  5. x
  6. )
  7. y=f(x)
  8. y=f(x)是
  9. R
  10. m
  11. +
  12. 1
  13. \mathbb{R}^{m+1}
  14. Rm+1中的一个凸曲面,而点
  15. (
  16. E
  17. (
  18. X
  19. )
  20. ,
  21. f
  22. (
  23. E
  24. (
  25. X
  26. )
  27. )
  28. )
  29. (\mathbb{E}(X),f(\mathbb{E}(X)))
  30. (E(X),f(E(X)))在次曲面上。存在一个过此点的平面,使得上述曲面全在此平面上的上方。若以
  31. y
  32. =
  33. f
  34. (
  35. E
  36. (
  37. X
  38. )
  39. )
  40. +
  41. c
  42. (
  43. x
  44. E
  45. (
  46. X
  47. )
  48. )
  49. y=f(\mathbb{E}(X))+c^{\prime}(x-\mathbb{E}(X))
  50. y=f(E(X))+c′(xE(X))记此平面的方程,则有
  51. f
  52. (
  53. x
  54. )
  55. f
  56. (
  57. E
  58. (
  59. X
  60. )
  61. )
  62. +
  63. c
  64. (
  65. x
  66. E
  67. (
  68. X
  69. )
  70. )
  71. f(x)\ge f(\mathbb{E}(X))+c^{\prime}(x-\mathbb{E}(X))
  72. f(x)≥f(E(X))+c′(xE(X))因而则有
  73. E
  74. (
  75. f
  76. (
  77. X
  78. )
  79. )
  80. f
  81. (
  82. E
  83. (
  84. X
  85. )
  86. )
  87. +
  88. c
  89. E
  90. (
  91. X
  92. E
  93. (
  94. X
  95. )
  96. )
  97. =
  98. f
  99. (
  100. E
  101. (
  102. X
  103. )
  104. )
  105. \mathbb{E}(f(X))\ge f(\mathbb{E}(X))+c^{\prime}\mathbb{E}(X-\mathbb{E}(X))=f(\mathbb{E}(X ))
  106. E(f(X))≥f(E(X))+cE(XE(X))=f(E(X))

(2)若

  1. f
  2. (
  3. x
  4. )
  5. f(x)
  6. f(x)是严格凸的,则除非
  7. x
  8. =
  9. E
  10. (
  11. X
  12. )
  13. x=\mathbb{E}(X)
  14. x=E(X),总有
  15. f
  16. (
  17. x
  18. )
  19. >
  20. f
  21. (
  22. E
  23. (
  24. X
  25. )
  26. )
  27. f(x)>f(\mathbb{E}(X))
  28. f(x)>f(E(X)),总有
  29. f
  30. (
  31. x
  32. )
  33. >
  34. f
  35. (
  36. E
  37. (
  38. X
  39. )
  40. )
  41. +
  42. c
  43. (
  44. x
  45. E
  46. (
  47. X
  48. )
  49. )
  50. f(x)>f(\mathbb{E}(X))+c^{\prime}(x-\mathbb{E}(X))
  51. f(x)>f(E(X))+c′(xE(X))成立,因而当且仅当
  52. P
  53. (
  54. X
  55. =
  56. E
  57. (
  58. X
  59. )
  60. )
  61. =
  62. 1
  63. P(X=\mathbb{E}(X))=1
  64. P(X=E(X))=1
  65. E
  66. (
  67. f
  68. (
  69. X
  70. )
  71. )
  72. =
  73. f
  74. (
  75. E
  76. (
  77. X
  78. )
  79. )
  80. \mathbb{E}(f(X))=f(\mathbb{E}(X))
  81. E(f(X))=f(E(X))成立。

**

  1. J
  2. e
  3. n
  4. s
  5. e
  6. n
  7. \mathrm{Jensen}
  8. Jensen不等式3:**
  9. f
  10. (
  11. x
  12. )
  13. f(x)
  14. f(x)是连续凸函数,
  15. X
  16. X
  17. X为关于
  18. g
  19. g
  20. g
  21. σ
  22. \sigma
  23. σ可积的随机变量,则
  24. f
  25. (
  26. X
  27. )
  28. f(X)
  29. f(X)关于
  30. g
  31. g
  32. g的条件期望存在,且有
  33. f
  34. (
  35. E
  36. [
  37. X
  38. g
  39. ]
  40. )
  41. E
  42. (
  43. f
  44. (
  45. X
  46. )
  47. g
  48. )
  49. f(\mathbb{E}[X|g])\ge \mathbb{E}(f(X)|g)
  50. f(E[Xg])≥E(f(X)∣g)几乎必然成立。

证明:

  1. f
  2. (
  3. x
  4. )
  5. f^{\prime}(x)
  6. f′(x)为
  7. f
  8. (
  9. x
  10. )
  11. f(x)
  12. f(x)的右导数,则对任意实数
  13. x
  14. x
  15. x
  16. y
  17. y
  18. y
  19. f
  20. (
  21. x
  22. )
  23. (
  24. y
  25. x
  26. )
  27. f
  28. (
  29. y
  30. )
  31. f
  32. (
  33. x
  34. )
  35. f^{\prime}(x)(y-x)\ge f(y)-f(x)
  36. f′(x)(yx)≥f(y)−f(x)以
  37. E
  38. [
  39. X
  40. g
  41. ]
  42. \mathbb{E}[X|g]
  43. E[Xg]及
  44. X
  45. X
  46. X代替上式中的
  47. x
  48. x
  49. x
  50. y
  51. y
  52. y得到
  53. f
  54. (
  55. E
  56. [
  57. X
  58. g
  59. ]
  60. )
  61. (
  62. X
  63. E
  64. [
  65. X
  66. g
  67. ]
  68. )
  69. +
  70. f
  71. (
  72. E
  73. [
  74. X
  75. g
  76. ]
  77. )
  78. f
  79. (
  80. X
  81. )
  82. f^{\prime}(\mathbb{E}[X|g])(X-\mathbb{E}[X|g])+f(\mathbb{E}[X|g])\le f(X)
  83. f′(E[Xg])(XE[Xg])+f(E[Xg])≤f(X)记上式左边的随机变量为
  84. Y
  85. Y
  86. Y,则
  87. Y
  88. Y
  89. Y关于
  90. g
  91. g
  92. g的条件期望存在,且
  93. E
  94. [
  95. Y
  96. g
  97. ]
  98. =
  99. f
  100. (
  101. E
  102. [
  103. X
  104. g
  105. ]
  106. )
  107. \mathbb{E}[Y|g]=f(\mathbb{E}[X|g])
  108. E[Yg]=f(E[Xg])将不等式两边同时取条件期望则有
  109. f
  110. (
  111. E
  112. [
  113. X
  114. g
  115. ]
  116. )
  117. E
  118. [
  119. f
  120. (
  121. X
  122. )
  123. g
  124. ]
  125. f(\mathbb{E}[X|g])\le \mathbb{E}[f(X)|g]
  126. f(E[Xg])≤E[f(X)∣g]几乎必然成立。

本文转载自: https://blog.csdn.net/qq_38406029/article/details/122792361
版权归原作者 鬼道2022 所有, 如有侵权,请联系我们删除。

“Jensen不等式”的评论:

还没有评论