局部加权线性回归(Locally weighted linear regression)

首先我们来看一个线性回归的问题，在下面的例子中，我们选取不同维度的特征来对我们的数据进行拟合。

对于上面三个图像做如下解释：

选取一个特征局部加权线性回归(Locally weighted linear regression) ，来拟合数据，可以看出来拟合情况并不是很好，有些数据误差还是比较大

针对第一个，我们增加了额外的特征局部加权线性回归(Locally weighted linear regression) ，，这时我们可以看出情况就好了很多。

这个时候可能有疑问，是不是特征选取的越多越好，维度越高越好呢？所以针对这个疑问，如最右边图，我们用5揭多项式使得数据点都在同一条曲线上，为局部加权线性回归(Locally weighted linear regression) 。此时它对于训练集来说做到了很好的拟合效果，但是，我们不认为它是一个好的假设，因为它不能够做到更好的预测。

针对上面的分析，我们认为第二个是一个很好的假设，而第一个图我们称之为欠拟合（underfitting），而最右边的情况我们称之为过拟合（overfitting）

所以我们知道特征的选择对于学习算法的性能来说非常重要，所以现在我们要引入局部加权线性回归，它使得特征的选择对于算法来说没那么重要，也就是更随性了。

局部加权线性回归是机器学习里的一种经典的方法，弥补了普通线性回归模型欠拟合或者过拟合的问题。机器学习里分为无监督学习和有监督学习，线性回归里是属于有监督的学习。普通的线性回归属于参数学习算法(parametric learning algorithm)；而局部加权线性回归属于非参数学习算法(non-parametric learning algorithm)。

在我们原始的线性回归中，对于输入变量局部加权线性回归(Locally weighted linear regression) ，我们要预测，通常要做：