与机器学习的第一次亲密基础- 3. 百家争鸣 or 一统天下？

数十年来，机器学习研究领域一直存在着派系之分，这有些类似于我国春秋战国时期的“百家争鸣”。所谓派系，无所谓对错，也无所谓优劣，只是认识问题的观点与解决问题的出发点不同罢了。那么，机器学习领域有几个派系呢？2015年，美国华盛顿大学的Domingos教授在ACM Webinar上给出了自己的观点，他认为在机器学习领域存在五大流派，分别为：符号学派、联结学派、进化学派、贝叶斯学派和类推学派。它们各自的主张、代表性人物及技术列举如下：

1) 符号学派

符号学派主要采用逻辑学与哲学的观点，主张采用规则、符号或者逻辑来表示知识，其认为学习是一个逆向演绎的过程，即在给定大量事实的基础上，做出某个假设，通过观察事实的匹配度，来决定该假设是否成立。当然，如果假设是成立的，那么就说明我们创造出了新的知识。这和我们人类的学习行为有很多相似之处，如我们总是在黑夜看到蝙蝠觅食，而在白天却基本看不到蝙蝠，那么我们就可能会做一个大胆的假设：“蝙蝠只有在夜间活动”，那么当你在书本中看到这条知识的时候，其实应该知道它是由大量的观察逆向演绎出来的。在日常生活中，这种学习的例子数不胜数。符号学派的代表人物有Mitchell和Quinlan等，代表性算法是决策树和规则分类器。

2) 联结学派

联结学派主要采用神经生理学的观点，主张采用人工神经网络来模仿学习行为。这也是最为人类所认同的一个机器学习学派，原因在于人类之所以会有学习的能力，都要拜大脑中的神经网络所赐。

图1.4给出了生物神经元，即神经细胞的基本形态及组成。生物神经元的结构极为独特，它看起来像一棵树，主要由细胞体和很多的突触组成。突触又分为树突和轴突两种，每个神经元可以有多个树突，但是只能有一个轴突。其中，树突可以接受刺激并将兴奋传递进细胞体，而轴突则负责向外部传递兴奋信号，可以传递给其它神经元，也可以传递给其它组织，比如肌肉或者腺体。在人类的大脑中，神经元是广泛互联的，这样便构成了一个庞大的神经网络。可以说，人类所学的知识都存储于神经元的突触中，表现为兴奋程度，而学习的过程则表现为某些神经元向另一些神经元传递信号的过程。

与机器学习的第一次亲密基础- 3. 百家争鸣 or 一统天下？

图1.4 神经元的形态及组成

联结学派认为既然人类可以通过神经网络来进行学习，那么如果为神经网络进行数学建模，模拟神经元间的信号传递过程，那么自然就可以实现机器学习。该学派较为有名的代表性人物有Hinton，LeCun和Bengio，这三个人也被称为深度学习三巨头，代表性算法则为BP算法。

3) 进化学派

进化学派主要采用了进化生物学的观点，主张采用遗传编码来是实现机器学习。他们认为联结学派虽然模仿了大脑关于学习的工作机制，但并没有从根本上弄清楚大脑神经网络的真正来源。因此，他们主张要搞清整个进化过程是如何进行的，并通过计算机来模拟同样的过程，以便实现学习。这一学派的代表性工具是遗传算法，由Holland教授于1975年提出，其主要特点是直接对结构对象进行操作，不存在求导和函数连续性的限定；具有并行性和更好的全局寻优能力；采用概率化的寻优方法，能自动获取和指导优化的搜索空间，自适应地调整搜索方向，不需要确定的规则。该学派的代表性人物包括Holland及Koza。事实上，这一学派通常也不被主流的机器学习领域所接纳，更多地将其视为计算智能或者软计算的一个分支。

4) 贝叶斯学派

贝叶斯学派一直是机器学习领域中的一个小流派，其基本思想完全基于贝叶斯理论。对于贝叶斯理论，相信学习过概率论的同学对其都不会太陌生，因为它是概率论中的一个定理，它与随机变量的条件概率和边缘概率分布有关，完全可以通过对历史事件进行统计，计算得出新事件的类属。所以，我们也可以说：贝叶斯学派崇尚运用概率和统计。举个简单的例子：假定你要设计一个垃圾邮件的过滤程序，那么首先需要对大量已有的邮件进行标注，人为区分哪些是正常邮件，哪些是垃圾邮件；然后，贝叶斯模型会自动统计所有邮件中出现的各类不同词的词频，计算得出其先验概率和条件概率；当某个词在新的邮件中出现时，模型可以直接计算出其后验概率，也就是在该词出现时，它是正常邮件及垃圾邮件的概率分别有多大；最后，通过比较两类的后验概率大小来确定邮件到底是否应该被过滤。贝叶斯学派的代表性人物包括Pearl，Jordan以及Heckerman。

5) 类推学派

类推学派可以说是机器学习的一个主要流派，其观点为：学习的关键就是要在不同场景中认识到相似性，然后再由此推导出其它相似性。简而言之，就是具有相似性质的事物通常也倾向于属于同一类别，比如：两个具有相似发病症状的患者，往往可能患有同一种疾病。由此可见，类推学派的观点非常接近大众对客观世界的认知，因此更容易为大众所接受。类推学派所关注技术的难点在于：如何衡量事物之间的相似性?是采用欧式距离、相关系数，还是其它度量？这往往是难于确定的。类推学派的代表性算法有：支持向量机、K近邻分类器以及K-means算法等。该学派的代表性人物包括：Hart、Vapnic以及Hofstadter。

图1.5清晰的描述了上述五大机器学习流派在观点上的联系与区别。从历史上来看，机器学习五大学派间的争斗历来不断，大有不打垮对方誓不罢休的启示，但在事实上，我们不得不承认这些流派的观点均有可取之处，又各自都有其局限性。众所周知，人类的学习行为是极其复杂的，因此难以以一种简单的模式来全面地对它进行模拟。在研究机器学习时，如果仅秉承某一观点而故步自封，则无异于“盲人摸象”，只能“管中窥豹，可见一斑”。目前，机器学习领域的研究者与开发者愈来愈意识到了这一问题的严重性，并开始逐渐倾向于走向融合。相信在不久的将来，那些复杂的机器学习应用系统必会融合多个学派的思想及算法模型，以期达到更为理想化的学习效果。

与机器学习的第一次亲密基础- 3. 百家争鸣 or 一统天下？

图1.5 五大机器学习流派间的联系与区别