一、线性回归
给定一组数据(xi,yi),yi是连续的,用线性模型y^i=hθ(xi)=θTxi,估计值y^i与实际值yi间存在误差εi,即
yi=θTxi+εi(1).
误差εi属于独立同分布的,根据大数定理,εi∼μ(0,σ2),则有:
p(εi)=2π1e−σ2εi2(2)
εi=yi−θTxi带入(2)式有,
p(yi∣xi,θ)=2π1e−σ2(yi−θTxi)2(3)
转成了xi,θ已知的情况下,yi发生的概率。
最大似然函数为
L(θ)=Πi=1mp(yi∣xi,θ)(4)
将(3)式带入(4)中,然后取对数,最后得到
J(θ)=21Σi=1m(hθ(xi)−yi)2=21(θTX−Y)T(θTX−Y)
通过最小二乘法,求出参数θ
方法二:最小均方误差(整体误差的平方和最小,几何方法)
cost(θ)=min21Σi=1m(hθ(xi)−yi)2(5)=min21(θTX−Y)T(θTX−Y)
为了求(5)式的最小值,由于cost(θ)>=0,对θ求导,导数为0的点记为参数θ的值,即可得出线性模型y^i=hθ(xi)=θTxi


在XTX中加入了λ后,带入J(θ)中,


二、通过交叉验证选取超参数