感知机算法 - 爱码网

利用带有0-1门限的神经元进行学习。
感知机算法
形式化如下：

感知机输入 $X = {x_{1}, x_{2}, . . ., x_{n}}$
感知机权值 $W = {w_{1}, w_{2}, . . ., w_{n}}$
偏置$b=1

令 $y (X) = W X^{T} + b$
感知机输出
$z (X) = {\begin{cases} 1, i f y (X) \geq 0 \\ 0, i f y (X) < 0 \end{cases}$

学习过程：
初始化感知机权重 $W$ ，有一个线性可分的训练集 $T = {X_{1}, X_{2}, . . ., X_{m}}$ 及标签集 $Y = {y_{1}, y_{2}, . . ., y_{m}}$ ，每次喂入一个样本 $X_{i}$ ，若 $y_{i} = z (X_{i})$ ，则不修正权重；若 $y_{i} = 1 且 z (X_{i}) = 0$ ，则更新 $W$ := $W + X_{i}$ ；若 $y_{i} = 0 且 z (X_{i}) = 1$ ，则更新 $W$ := $W - X_{i}$ 。直到迭代完 $T$ 。

From geometry perspective，在权重空间（Weight space）内，把所有的权重 $W$ 和训练集 $T$ 中的样本 $X_{i}$ 视作一些从原点出发的向量(或者点)，则对于任意给定的向量 $X_{i}$ ，存在一个过原点的超平面把空间分成两部分，其中一个子空间内的 $W$ 都能把 $X_{i}$ 预测为0，另一个子空间内的 $W$ 都能把 $X_{i}$ 预测为1。根据的 $y_{i}$ 可以分别命名为当前样本的“好的权重向量子空间”和“坏的权重向量子空间”。
感知机算法
算法的所做的就是，若当前权重 $W$ 位于当前样本的“好的权重向量子空间”时不需要进行更新，否则旋转 $W$ 使得更接近分界超平面。于是的到了一个凸优化问题。

(图来自Hinton)