极大似然估计

一、离散型统计模型
L(θ)=i=1nPθ(Xi=xi) \boldsymbol{L}\left( \boldsymbol{\theta } \right) =\prod_{\boldsymbol{i}=1}^{\boldsymbol{n}}{\boldsymbol{P}_{\boldsymbol{\theta }}}\left( \boldsymbol{X}_{\boldsymbol{i}}=\boldsymbol{x}_{\boldsymbol{i}} \right)
二、连续型统计模型
L(θ)=i=1nPθ(Xi=xi) \boldsymbol{L}\left( \boldsymbol{\theta } \right) =\prod_{\boldsymbol{i}=1}^{\boldsymbol{n}}{\boldsymbol{P}_{\boldsymbol{\theta }}}\left( \boldsymbol{X}_{\boldsymbol{i}}=\boldsymbol{x}_{\boldsymbol{i}} \right)
极大似然估计MLE 的理解及代码
似然函数的直观意义就是:利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值寻 θ\theta
那么要怎么寻找与数据的匹配程度呢?

这里举一个例子:假设一个盒子里有10个球,3个白球,7个红球,进行有放回的抽取,那么我们可以知道抽到白球的概率θ\theta为3/10,抽到红球的概率为7/10。但是这里只是我们的直觉,我们的直观的感受,但是我们要找到一个理论来描述我们这个直觉,那应该怎么做呢?这就用到了极大似然估计。

x 白球 红球
p θ\theta 1- θ\theta

这里假设一共有n个球,其中白球有n1n_1个,红球有n2n_2个,那么我们的直觉告诉我们
直觉θ\theta=n1n_1/n

那么带到公式里面去,就得到:
L(θ)=θn1(1θ)n2 \boldsymbol{L}\left( \boldsymbol{\theta } \right) =\boldsymbol{\theta }^{\boldsymbol{n}_1}\left( 1-\boldsymbol{\theta } \right) ^{\boldsymbol{n}_2}
好,现在似然函数写出来了,我们就要寻找使L(θ)L(\theta)取得最大(最趋近于1的时候)的时候θ\theta的取值,这里就用到高数里的求偏导。
但是这个式子是相乘的求偏导比较复杂,我们取对数,使其转成相加的就更好求导。
ln(L(θ))=ln(θn1(1θ)n2) \ln \left( \boldsymbol{L}\left( \boldsymbol{\theta } \right) \right) =\ln \left( \boldsymbol{\theta }^{\boldsymbol{n}_1}\left( 1-\boldsymbol{\theta } \right) ^{\boldsymbol{n}_2} \right)
ln(L(θ))=n1lnθ+n2ln(1θ) \ln \left( \boldsymbol{L}\left( \boldsymbol{\theta } \right) \right) =\boldsymbol{n}_1\ln \boldsymbol{\theta }+\boldsymbol{n}_2\ln \left( 1-\boldsymbol{\theta } \right)
dln(L(θ))dθ=n1θn21θ=0 \frac{\boldsymbol{d}\ln \left( \boldsymbol{L}\left( \boldsymbol{\theta } \right) \right)}{\boldsymbol{d\theta }}=\frac{\boldsymbol{n}_1}{\boldsymbol{\theta }}-\frac{\boldsymbol{n}_2}{1-\boldsymbol{\theta }}=0
θ^=n1n1+n2=n1n \boldsymbol{\hat{\theta}}=\frac{\boldsymbol{n}_1}{\boldsymbol{n}_1+\boldsymbol{n}_2}=\frac{\boldsymbol{n}_1}{\boldsymbol{n}}

那么这里就得出θ\theta与我们的取直觉相符合了

相关文章: