机器学习
01 - 04课时笔记
定义:用 P 来测量计算机程序在任务 T 中的性能,若程序能利用经验 E 在 T 任务中获得了性能改善,则关于任务 T 和性能测量 P,该程序对经验 E 进行了学习。
1. 监督学习
在监督式学习中,首先有一个数据集,并且已知正确的输出是什么,且输入和输出存在关联。
-
回归问题
预测连续的数值输出,例如根据面积预测房价,根据照片预测年龄。
-
分类问题
预测离散的输出值,将输入变量映射到离散类别中。例如根据肿瘤尺寸大小,预测是恶性还是良性。
- 单个特征/属性:肿瘤大小
-
多特征/属性:肿瘤大小、年龄
Q:若是有无穷多的特征该怎么处理呢?
2. 无监督学习
无监督学习使我们能够很少或根本不知道我们的结果应该是什么样子。数据没有标签/正确答案或很少标签(半监督学习)。例如谷歌新闻,用聚类算法将每天几万条新闻组合为一个个新闻专题簇。