一、监督学习
监督(supervised)是指训练数据集中的每个样本均有一个已知的输出项(类标label)。
输出变量为连续变量的预测问题成为回归(regression)问题(例如西瓜成熟度)。
输出变量为有限个离散变量的预测问题成为分类问题(例如西瓜的分类)。
二、非监督学习(unsupervised learning)
给机器一大堆没有分类标记的数据,让机器可以对数据分类、检测异常等。
(一)聚类
通过特征之间的相似性
(二)降维
通过机器学习算法达到降维目的,区别于特征选择
三、半监督学习
提供了一条利用“廉价”的未标记样本的途径
四、强化学习(解决连续问题)
是机器学习的一个重要分支,主要用来解决连续决策的问题。例如围棋可以归纳为一个强化学习问题,需要学习在各种局势下如何走出最好的招法
五、迁移学习(解决小数据集、个性化和模型适用性问题)
六、深度强化迁移学习