数十年来,机器学习研究领域一直存在着派系之分,这有些类似于我国春秋战国时期的“百家争鸣”。所谓派系,无所谓对错,也无所谓优劣,只是认识问题的观点与解决问题的出发点不同罢了。那么,机器学习领域有几个派系呢?2015年,美国华盛顿大学的Domingos教授在ACM Webinar上给出了自己的观点,他认为在机器学习领域存在五大流派,分别为:符号学派、联结学派、进化学派、贝叶斯学派和类推学派。它们各自的主张、代表性人物及技术列举如下:
1) 符号学派
符号学派主要采用逻辑学与哲学的观点,主张采用规则、符号或者逻辑来表示知识,其认为学习是一个逆向演绎的过程,即在给定大量事实的基础上,做出某个假设,通过观察事实的匹配度,来决定该假设是否成立。当然,如果假设是成立的,那么就说明我们创造出了新的知识。这和我们人类的学习行为有很多相似之处,如我们总是在黑夜看到蝙蝠觅食,而在白天却基本看不到蝙蝠,那么我们就可能会做一个大胆的假设:“蝙蝠只有在夜间活动”,那么当你在书本中看到这条知识的时候,其实应该知道它是由大量的观察逆向演绎出来的。在日常生活中,这种学习的例子数不胜数。符号学派的代表人物有Mitchell和Quinlan等,代表性算法是决策树和规则分类器。
2) 联结学派
联结学派主要采用神经生理学的观点,主张采用人工神经网络来模仿学习行为。这也是最为人类所认同的一个机器学习学派,原因在于人类之所以会有学习的能力,都要拜大脑中的神经网络所赐。
图1.4给出了生物神经元,即神经细胞的基本形态及组成。生物神经元的结构极为独特,它看起来像一棵树,主要由细胞体和很多的突触组成。突触又分为树突和轴突两种,每个神经元可以有多个树突,但是只能有一个轴突。其中,树突可以接受刺激并将兴奋传递进细胞体,而轴突则负责向外部传递兴奋信号,可以传递给其它神经元,也可以传递给其它组织,比如肌肉或者腺体。在人类的大脑中,神经元是广泛互联的,这样便构成了一个庞大的神经网络。可以说,人类所学的知识都存储于神经元的突触中,表现为兴奋程度,而学习的过程则表现为某些神经元向另一些神经元传递信号的过程。
图1.4 神经元的形态及组成
联结学派认为既然人类可以通过神经网络来进行学习,那么如果为神经网络进行数学建模,模拟神经元间的信号传递过程,那么自然就可以实现机器学习。该学派较为有名的代表性人物有Hinton,LeCun和Bengio,这三个人也被称为深度学习三巨头,代表性算法则为BP算法。
3) 进化学派
进化学派主要采用了进化生物学的观点,主张采用遗传编码来是实现机器学习。他们认为联结学派虽然模仿了大脑关于学习的工作机制,但并没有从根本上弄清楚大脑神经网络的真正来源。因此,他们主张要搞清整个进化过程是如何进行的,并通过计算机来模拟同样的过程,以便实现学习。这一学派的代表性工具是遗传算法,由Holland教授于1975年提出,其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有并行性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。该学派的代表性人物包括Holland及Koza。事实上,这一学派通常也不被主流的机器学习领域所接纳,更多地将其视为计算智能或者软计算的一个分支。
4) 贝叶斯学派
贝叶斯学派一直是机器学习领域中的一个小流派,其基本思想完全基于贝叶斯理论。对于贝叶斯理论,相信学习过概率论的同学对其都不会太陌生,因为它是概率论中的一个定理,它与随机变量的条件概率和边缘概率分布有关,完全可以通过对历史事件进行统计,计算得出新事件的类属。所以,我们也可以说:贝叶斯学派崇尚运用概率和统计。举个简单的例子:假定你要设计一个垃圾邮件的过滤程序,那么首先需要对大量已有的邮件进行标注,人为区分哪些是正常邮件,哪些是垃圾邮件;然后,贝叶斯模型会自动统计所有邮件中出现的各类不同词的词频,计算得出其先验概率和条件概率;当某个词在新的邮件中出现时,模型可以直接计算出其后验概率,也就是在该词出现时,它是正常邮件及垃圾邮件的概率分别有多大;最后,通过比较两类的后验概率大小来确定邮件到底是否应该被过滤。贝叶斯学派的代表性人物包括Pearl,Jordan以及Heckerman。
5) 类推学派
类推学派可以说是机器学习的一个主要流派,其观点为:学习的关键就是要在不同场景中认识到相似性,然后再由此推导出其它相似性。简而言之,就是具有相似性质的事物通常也倾向于属于同一类别,比如:两个具有相似发病症状的患者,往往可能患有同一种疾病。由此可见,类推学派的观点非常接近大众对客观世界的认知,因此更容易为大众所接受。类推学派所关注技术的难点在于:如何衡量事物之间的相似性?是采用欧式距离、相关系数,还是其它度量?这往往是难于确定的。类推学派的代表性算法有:支持向量机、K近邻分类器以及K-means算法等。该学派的代表性人物包括:Hart、Vapnic以及Hofstadter。
图1.5清晰的描述了上述五大机器学习流派在观点上的联系与区别。从历史上来看,机器学习五大学派间的争斗历来不断,大有不打垮对方誓不罢休的启示,但在事实上,我们不得不承认这些流派的观点均有可取之处,又各自都有其局限性。众所周知,人类的学习行为是极其复杂的,因此难以以一种简单的模式来全面地对它进行模拟。在研究机器学习时,如果仅秉承某一观点而故步自封,则无异于“盲人摸象”,只能“管中窥豹,可见一斑”。目前,机器学习领域的研究者与开发者愈来愈意识到了这一问题的严重性,并开始逐渐倾向于走向融合。相信在不久的将来,那些复杂的机器学习应用系统必会融合多个学派的思想及算法模型,以期达到更为理想化的学习效果。
图1.5 五大机器学习流派间的联系与区别