贝叶斯估计与极大似然估计在思想上有很大的不同,代表着统计学中贝叶斯学派和频率学派对统计的不同认识。
极大似然估计是频率学派观点,它的观点可以这样理解:待估计参数θ是客观存在的,只是未知而已,已知观测样本 D,求得 θ^,使得在 θ=θ^ 时,产生观测样本数据 D 的可能性最大,我们就说 θ^ 是 θ 的极大似然估计。
θ^=arg θmax P(D∣θ)
贝叶斯估计是贝叶斯学派观点,它的观点可以这样理解:待估计参数 θ 也是随机变量,因此只能根据观测样本估计参数 θ 的分布。
P^(θ∣D)=P(D)P(θ)P(D∣θ)=∑j=1nP(θj)P(D∣θj)P(θ)P(D∣θ)
其中,P(θ) 是 θ 的先验分布。由于后验分布是一个条件分布,通常我们取后验分布的期望作为参数的估计值。
因此,极大似然估计是在观测样本数据 D 后,求出 θ 最有可能的值(即在这个值下,观测到D的可能性最大);而贝叶斯估计则是在假定θ服从P(θ)的先验分布下(对于极大似然估计来说,默认θ是均匀分布的),通过观测样本数据D, 求出 θ 的后验分布。
其实,可以简单地把两者联系起来,假设先验分布是均匀分布,取后验概率最大,就能从贝叶斯估计得到极大似然估计。
