M-P模型
1943年,McCulloch and Pitts抽象出了“M-P神经元模型”,神经元接受到来自
**函数
理想中的**函数如下图所示的阶跃函数,它将输入值映射为输出值0 (对应于神经元抑制)或 1(对应于神经元兴奋)。
但是,阶跃函数在
因此,需要找一个近似于阶跃函数的连续函数替代它。
这个函数便是
并且它有一个非常好的性质:
感知机
感知机由两层神经元组成,输入层接受外界输入信号后传递给输出层,输出层是M-P神经元。如下图所示,
机器学习到底学的是什么
如上图所示的
再看感知机
感知机只有输出层神经元进行**函数处理,属于一层功能神经元(functional neuron),其学习能力非常有限。
对于这个一层功能神经元模型,只能处理线性可分的问题,比如与,或,非的问题,对这些问题的学习,感知机一定可以收敛,并且存在一个线性超平面将它们分开,如下图所示,可以求得适当的权向量
观察上图d
发现它有两个超平面来包裹了一个区域,求解异或问题,已经不是线性问题了,而是非线性问题,需要考虑一种解决非线性问题的网络。
飞跃到多层功能神经元
如下图所示,是两层感知机(两层功能神经元)。
输出层与输入层之间的一层神经元,称为隐含层(hidden layer)。
隐含层和输出层都是拥有**函数的功能神经元。
多层前馈神经网络
更一般地,常见的神经网络是如图所示的层级结构,每层神经元与下一层神经元互联,神经元之间存在同层连接,也不存在跨层连接。这样的网络结构称为“多层前馈神经网络”(mutli-layer feedforward neural networks)。
参考
本文属于常规概念总结,参考周志华 《机器学习》