CS229_0

监督学习(Supervised Learning)

首先我们通过一些例子来讨论监督学习问题吧。假设我们有如下数据集:

CS229学习笔记(0)

我们可以将上述数据集绘制成如下图所示:

CS229学习笔记(0)

那么我们如何根据这些数据集预测其他房屋的价格呢?

为了今后更好地学习,以上例为例,我们将房屋面积定义为输入变量x(i),其亦称为特征变量;将房屋价格定义为输出变量y(i),其亦称为目标变量;(x(i),y(i))表示一个训练实例,其中上标i表示第i个训练实例;集合{(x(i),y(i));i=1,,m}表示训练集,其中m表示训练集的大小。

当然,我们也可使用χ表示输入变量空间,Y表示输出变量空间。在房屋价格此例中,χ=Y=R

在监督学习问题中,我们对给定的数据集,学习到一个函数h:χY, 该函数h(x)能够很好地预测目标变量。通常,我们将该函数h(x)称为假设函数(Hypothesis Function),其处理流程如下图所示:

CS229学习笔记(0)

当输出变量为连续值时,我们将其问题称为回归问题(Regression Problem);当输出变量为离散值时,我们将其问题称为分类问题(Classification Problem)。

相关文章: