1.模型表示
我们的第一个学习算法是线性回归算法,我们将在之后得到这个算法,
而且我们会了解到监督学习的一个完整流程。
那么我们同样以预测房价的例子来学习,例如我们已知一个数据集里面有
王八村的一些出售房价的信息,那么我们手里有一套房子,例如120平方米
那么我们可以利用线性回归算法来进行预测,这显然是一个监督学习问题,
因为对于每一个数据而言,我们给出了正确的答案,即告诉我们,对于我们的
数据而言,房子的实际价格是多少,或者更具体的说,这是一个回归问题,我们根据
之前的数据预测出一个准确的输出值,对于这个例子而言就是价格。
那么我们规定一些记号对于之后的学习也是有帮助的,一个东西无论什么有了
名字就有了力量。
假设我们回归问题的数据集(Training set)如下表示
我们将要用来描述这个回归问题的标记如下:
我们把我们的训练集中的数据喂给我们的学习算法,最后
我们应该得到一个函数,称为h(hypothesis),这在我们的例子中是一个关于x与y的
映射,那么对于这个h函数,我们便可以把我们想要的预测房屋的数据输入,得到预测值。
那么我们该如何表示h呢,一种表示的方法是
我们可以看到,这个方程里只有一个特征/输入变量,因此这样的问题叫做单变量
线性回归问题。