机器学习系统的类型

根据常见规则进行分类:

  • 是否在人工监督下进行训练:监督学习(Supervised Learning)、非监督(Unsupervised Learning)、半监督学习(Semisupervised Learning)、强化学习(Reinforcement Learning)
  • 是否可以动态渐进学习:在线学习(Online Learning) vs 批量学习(Batch Learning)
  • 是否通过简单地比较新的数据点和已知数据点,或者在训练中进行模式识别:基于实例学习(Instance-based Learning) vs 基于模型学习(Model-based Learning)

监督/非监督学习

区别:有没有告诉你答案?

监督学习

在监督学习中,用来训练算法的训练集包含了答案,也称为标签。

机器学习系统分类
监督学习

典型的监督学习任务是分类。 垃圾邮件过滤器就是一个很好的例子: 用许多带有归类(垃圾邮件或普通邮件) 的邮件样本进行训练, 过滤器必须还能对新邮件进行分类。

常见的监督学习算法:

  • K近邻算法
  • 线性回归(Linear Regression)
  • 逻辑回归(Logistic Regression)
  • 支持向量机(Support Vector Machines,SVMs)
  • 决策树和随机森林(Decision Trees and Random Forests)
  • 神经网络(Neural network)

非监督学习

在非监督学习中,训练集是没有给出答案或者标签,是在没有人工规定条件下进行学习。

机器学习系统分类
非监督学习

常见非监督学习算法:

  1. 聚类

K均值

层次聚类分析(Hierarchical Cluster Analysis, HCA)

期望最大值

  1. 可视化和降维

主成分分析( Principal Component Analysis, PCA)

核主成分分析

局部线性嵌入( Locally-Linear Embedding, LLE)

t-分布邻域嵌入算法( t-distributed Stochastic Neighbor Embedding, t-SNE)

  1. 关联性规则学习

Apriori 算法

Eclat 算法

半监督学习

一些算法可以处理部分带标签的训练数据, 通常是大量不带标签数据加上小部分带标签数
据。 这称作半监督学习。

机器学习系统分类
半监督学习

多数半监督学习算法是非监督和监督算法的结合。 例如, 深度信念网络( deep beliefnetworks) 是基于被称为互相叠加的受限玻尔兹曼机( restricted Boltzmann machines,RBM) 的非监督组件。 RBM 是先用非监督方法进行训练, 再用监督学习方法进行整个系统微调。

强化学习

强化学习非常不同。学习系统在这里被称为智能体(agent),可以对环境进行观察,选择和执行动作,获得奖励(负奖励是惩罚) 。 然后它必须自己学习哪个是最佳方法(称为策略, policy),以得到长久的最大奖励。策略决定了智能体在给定情况下应该采取的行动。

机器学习系统分类
强化学习

相关文章: