利用带有0-1门限的神经元进行学习。
形式化如下:
感知机输入
感知机权值
偏置$b=1令
感知机输出
学习过程:
初始化感知机权重,有一个线性可分的训练集及标签集,每次喂入一个样本,若,则不修正权重;若,则更新:=;若,则更新:=。直到迭代完。
From geometry perspective,在权重空间(Weight space)内,把所有的权重和训练集中的样本视作一些从原点出发的向量(或者点),则对于任意给定的向量,存在一个过原点的超平面把空间分成两部分,其中一个子空间内的都能把预测为0,另一个子空间内的都能把预测为1。根据的可以分别命名为当前样本的“好的权重向量子空间”和“坏的权重向量子空间”。
算法的所做的就是,若当前权重位于当前样本的“好的权重向量子空间”时不需要进行更新,否则旋转使得更接近分界超平面。于是的到了一个凸优化问题。
(图来自Hinton)