在线性回归中,我们最常用到的是最小二乘法,给定一组样本 ,
我们希望找到一种映射关系 :
接下来我们从贝叶斯估计出发,探讨最小二乘与贝叶斯估计中最大似然估计和最大后验概率估计的关系。因为 的近似估计,所以两者满足如下的关系:
如果我们假设 即为方差的倒数。那么我们有:
进一步假设样本分布满足 i.i.d 即独立同分布,那么这组样本的联合概率满足:
利用最大似然估计,可以得到:
而
可以看到,高斯分布下的最大似然估计就是最小二乘。我们可以求出最优的为:
那么给定一个新的 满足如下的高斯分布,
显然,当 的时候,所对应的概率是最大的。从最大似然估计出发,我们可以得到最小二乘。
接下来,考虑最大后验概率估计,给 的分布也是满足高斯形式:
根据贝叶斯定理,我们知道后验概率与先验概率和似然函数之积是成一定比例的:
利用最大似然估计,对 取对数,去掉无关项,我们可以得到如下的表达式:
令 , 那么上式可以写成:
这个就是带正则项的最小二乘,这个可以减轻over fitting的问题。所以最大后验概率估计对应的就是带正则项的最小二乘。
所以,通过高斯分布,可以将贝叶斯估计与最小二乘联系起来。
>
C.M.Bishop, “Pattern Recognition and Machine Learning”.