这篇博客将主要针对西瓜书3.1和3.2节(一元线性回归)的内容进行补充。主要有如何判断出一元线性回归损失函数是一个凸函数以及如何将w值向量化表示。
对于一元线性回归,假设f(xi)=wxi+b,i=1,2,3...,我们的目的就是为了让f(xi)尽可能与yi接近。我们需要确定w,b这两个值,使得损失函数最小(拟合)。这里我们用均方误差E(w,b)来作为损失函数。
E(w,b)=i=1∑m(yi−wxi−b)2(1)
我们可以看到公式(1)是一个二元的函数,所以我们可以对其求偏导判断其是凸函数还是凹函数(这一点西瓜书中没有证明)。

对w,b分别求一次偏导数,得φwφE(w,b)=2(wi=1∑mxi2−i=1∑m(yi−b)xi)(2)
φbφE(w,b)=2(mb−i=1∑m(yi−wxi))(3)
继而求出二次偏导数分别为,
A=2i=1∑mxi2,B=2i=1∑mxi,C=2m
根据已知可得A一定会大于0(xi一定不会全是0的),我们便关注到AC−B2上面。
下面进行证明AC−B2≥0:
AC−B2=2m⋅2∑i=1mxi2−4(∑i=1mxi)2
=4m∑i=1mxi2−4m⋅m1(∑i=1mxi)⋅(∑i=1mxi)
=4m∑i=1mxi2−4m⋅x⋅∑i=1mxi
=4m∑i=1m(xi2−x⋅xi)
又因为
∑i=1mxix=x⋅m1⋅∑i=1mxi=m⋅x⋅xi=∑i=1mx2
所以
AC−B2=4m∑i=1m(xi2−xxi+xxi−xxi)
=4m∑i=1m(xi2−2xxi+x2)
=4m∑i=1m(xi−x)2≥0
所以E(w,b)是一个凸函数(即类似y=x^2这个函数)
因此E(w,b)的驻点将是最小点。
之后便是按部就班求值了。
求出(2) = 0及(3) = 0时,w,b的表达式为(为了计算方便,最好先计算出b的表达式):
b=m1i=1∑m(yi−wxi)=y−wx
w=∑i=1mxi2−m1(∑i=1mxi)2∑i=1myi(xi−x)
背书去了,明日有时间再更一元线性回归(二)