PRML公式(1.118)是关于Kullback-Leibler散度恒大于等于 0
KL(p∣∣q)=−∫p(x)ln{p(x)q(x)}dx≥−ln∫q(x)dx=0(1.118)
书上说可以用公式(1.117)得到(1.118)的结果。
f(∫xp(x)dx)≤∫f(x)p(x)dx(1.117)
我自己怎么推也推不过去。公式(1.116)看上去可以借鉴。
f(E[x])≤E[f(x)](1.116)
如果把f() 换成 −ln() , 把 x 换成 p(x)q(x) 好像可以得到(1.118)的结果。但积分中dx 中的x 怎样处理呢?
谷歌发现 More PRML Rrrata ,在第7页中给出了Jensen’s inequality in terms of random variables(含隐随机变量的Jensen不等式)。
f(Ez[ξ(z)])≤Ez[f(ξ(z))](21)
(21) 比 (1.116)具有更广的通用性(giving a result slightly more general than (1.116))。
把f() 换成 −ln() , 把 ξ(z) 换成 p(x)q(x) 带入 (21) 就可以得到(1.118) 的结果。
Ex[f(ξ(x))]≥f(Ex[ξ(x)])Ex[−ln(p(x)q(x))]≥−ln(Ex[p(x)q(x)])−∫ln{p(x)q(x)}p(x)dx≥−ln∫p(x)q(x)p(x)dx−∫p(x)ln{p(x)q(x)}dx≥−ln∫q(x)dx=0KL(p∣∣q)≥0(A)
More PRML Rrrata 给出了图像方式的“证明”。
