PRML公式(1.118)是关于Kullback-Leibler散度恒大于等于 0
(1.118)KL(pq)=p(x)ln{q(x)p(x)}dxlnq(x)dx=0KL(p||q)=-\int p(x)ln \bigg \{ \frac{q(x)}{p(x)} \bigg \} dx \geq -ln \int q(x)dx=0 \tag{1.118}
书上说可以用公式(1.117)得到(1.118)的结果。
(1.117)f(xp(x)dx)f(x)p(x)dx f \bigg ( \int xp(x)dx \bigg ) \leq \int f(x)p(x)dx \tag{1.117}
我自己怎么推也推不过去。公式(1.116)看上去可以借鉴。
(1.116)f(E[x])E[f(x)] f(E[x]) \leq E[f(x)] \tag{1.116}
如果把f()f() 换成 ln()-ln() , 把 xx 换成 q(x)p(x)\frac{q(x)}{p(x)} 好像可以得到(1.118)的结果。但积分中dxdx 中的xx 怎样处理呢?

谷歌发现 More PRML Rrrata ,在第7页中给出了Jensen’s inequality in terms of random variables(含隐随机变量的Jensen不等式)。
(21)f(Ez[ξ(z)])Ez[f(ξ(z))] f(E_z[\xi(z)]) \leq E_z[f(\xi(z))] \tag{21}

(21) 比 (1.116)具有更广的通用性(giving a result slightly more general than (1.116))。

f()f() 换成 ln()-ln() , 把 ξ(z)\xi(z) 换成 q(x)p(x)\frac{q(x)}{p(x)} 带入 (21) 就可以得到(1.118) 的结果。

(A)Ex[f(ξ(x))]f(Ex[ξ(x)])Ex[ln(q(x)p(x))]ln(Ex[q(x)p(x)])ln{q(x)p(x)}p(x)dxlnq(x)p(x)p(x)dxp(x)ln{q(x)p(x)}dxlnq(x)dx=0KL(pq)0 E_x[f(\xi(x))]\geq f(E_x[\xi(x)]) \\ \quad \\ E_x[-ln(\frac{q(x)}{p(x)})] \geq -ln(E_x[\frac{q(x)}{p(x)}]) \\ \quad \\ -\int ln \bigg \{ \frac{q(x)}{p(x)} \bigg \} p(x)dx \geq -ln \int \frac{q(x)}{p(x)}p(x)dx \\ \quad \\ -\int p(x) ln\bigg \{ \frac{q(x)}{p(x)} \bigg \} dx \geq -ln \int q(x)dx=0 \\ \quad \\ KL(p||q) \geq 0 \tag{A}

More PRML Rrrata 给出了图像方式的“证明”。
PRML书中公式(1.118)KL散度恒大于等于 0的推导


相关文章:

  • 2021-05-26
  • 2021-12-03
  • 2021-06-20
  • 2022-12-23
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2021-10-05
  • 2021-12-03
  • 2021-05-20
相关资源
相似解决方案