信息论研究问题
  • 信源编码
    数据压缩极限
  • 信道编码
    信道容量极限

主要以香农理论为主

信息

消除不确定性

信息度量

不确定性消除程度
不确定的程度于事件概率相关
(信息量是概率的单调递减函数)

自信息量

I(x)=log(p(x)) I(x)=-log(p(x))
其中
p(xi)>p(xj)p(xi)<p(xj)I(0)=I(1)=0 p(x_{i})>p(x_{j})\rightarrow p(x_{i})<p(x_{j})\\I(0)=∞\\I(1)=0
对统计独立事件
I(xi,xj)=I(xi)+p(xj) I(x_{i},x_{j})=I(x_{i})+p(x_{j})
对数的底为

  • 2 量纲为bit
  • e 量纲为nat

H(X)=p(x)log(p(x)) H(X)=-\sum p(x)log(p(x))
是平均不确定性,平均信息量
H(X)=E(I(X)) H(X)=E(I(X))
规定
0log0=0 0log0=0
零概率事件不影响熵

熵的性质
  • 非负
    当事件确定,熵为0
  • 事件给定,熵为定值
  • 离散熵有限
  • 仅依赖于概率分布
伯努利分布的熵

信息论笔记整理(一)

联合熵

H(X,Y)=p(x,y)log(p(x,y))=E(log(p(X,Y))) H(X,Y)=-\sum \sum p(x,y)log(p(x,y))\\=-E(log(p(X,Y)))

条件熵

H(YX)=p(x)H(YX=x)=p(x,y)logp(yx)=E(log(p(YX))) H(Y|X)=\sum p(x)H(Y|X=x)\\=-\sum \sum p(x,y)logp(y|x)\\ =-E(log(p(Y|X)))

熵的链式法则

H(X,Y)=H(X)+H(YX) H(X,Y)=H(X)+H(Y|X)
当X,Y统计独立
H(X,Y)=H(X)+H(Y) H(X,Y)=H(X)+H(Y)

相对熵

D(pq)=p(x)logp(x)q(x)=Eplogp(X)q(X) D(p||q)=\sum p(x)log\frac {p(x)}{q(x)}\\ =E_{p}log\frac {p(X)}{q(X)}
约定0log00=0;0log0q=0;plogp0=00log\frac {0}{0}=0;0log\frac {0}{q}=0;plog\frac {p}{0}=0

相对熵性质
  • 非负
    当且仅当p=qp=q相对熵为0
  • 若有p(x)>0,q(x)=0p(x)>0,q(x)=0则有D(pq)=D(p||q)=∞
  • 不是真正的距离
互信息

I(X;Y)=p(x,y)logp(x,y)p(x)q(y)=D(p(x,y)p(x)q(y))=Ep(x,y)logp(X,Y)p(X)p(Y) I(X;Y)=\sum \sum p(x,y)log\frac {p(x,y)}{p(x)q(y)}\\ =D(p(x,y)||p(x)q(y))\\ =E_{p(x,y)}log\frac {p(X,Y)}{p(X)p(Y)}
表示给定一个随机变量对另一个随机变量不确定度造成的缩减量
推论
I(X;Y)=H(X)H(XY) I(X;Y)=H(X)-H(X|Y)

凸函数

f(λx1+(1λ)x2)λf(x1)+(1λ)f(x2) f(λx_{1}+(1-λ)x_{2})\leqslant λf(x_{1})+(1-λ)f(x_{2})
例如f(x)=xlog(x)f(x)=xlog(x)

凹函数

f(λx1+(1λ)x2)λf(x1)+(1λ)f(x2) f(λx_{1}+(1-λ)x_{2})\geqslant λf(x_{1})+(1-λ)f(x_{2})
例如lf(x)=log(x)lf(x)=log(x)

Jensen不等式

f(X)f(X)凸函数,有
Ef(X)f(EX) Ef(X)\geqslant f(EX)

熵的其他性质
  • 极值性
    H(X)logχH(X)\leq log|\chi |
  • 条件使熵减少
    H(XY)H(X) H(X|Y)\leq H(X)
  • 独立界
    H(X1,...,Xn)H(Xi) H(X_{1},...,X_{n})\leq \sum H(X_{i})
马尔可夫链

p(x,y,z)=p(x)p(yx)p(zy) p(x,y,z)=p(x)p(y|x)p(z|y)

  • Y给定,X,Z条件独立
  • X->Y->Z蕴含Z->Y->X
数据处理不等式

若X->Y->Z

I(X;Y)I(X;Z) I(X;Y)\geq I(X;Z)
等号成立条件当且仅当I(X;YZ)=0I(X;Y|Z)=0
推论I(X;YZ)I(X;Y)I(X;Y|Z)\leq I(X;Y)

费诺不等式

对于XYX^X\rightarrow Y\rightarrow \hat{X}
Pe=PrXX^P_{e}=PrX \neq \hat{X}

H(Pe)+PelogχH(XX^)H(XY) H(P_{e})+P_{e}log|\chi |\geq H(X|\hat{X})\geq H(X|Y)
弱化为
1+PelogχH(XY) 1+P_{e}log|\chi |\geq H(X|Y)

相关文章: