【发布时间】:2018-10-30 08:10:34
【问题描述】:
【问题讨论】:
标签: machine-learning neural-network perceptron
【问题讨论】:
标签: machine-learning neural-network perceptron
调整是向量加减法,可以认为是旋转超平面,使0 类落在一个部分,1 类落在另一部分。
考虑一个1xd 权重向量,表示感知器模型的权重。另外,考虑1xd 数据点。那么在不失一般性的情况下,考虑线性阈值的感知器模型的预测值将是
这里是“。”是点积,或
上面方程的超平面是
(为简单起见,忽略权重更新的迭代索引)
假设我们有两个类0 和1,同样不失一般性,标记为0 的数据点落在超平面的Eq.1 0 的另一边。
这个超平面法线的向量是。标签为0 的数据点之间的角度应大于90 度,标签为1 的数据点之间的数据点应小于90 度。
1,但目前的权重集将其分类为0。方程 1。 应该是 。方程1。在这种情况下是,这表明 和 之间的角度大于 90 度,应该更小。更新规则为。如果您想像在 2d 中添加向量,这将旋转超平面,使 和 之间的角度比以前更近且小于90 度。 0,但目前的权重集将其分类为1。 eq1。 应该是 。方程1。在这种情况下是 表示 和 之间的角度小于 90 度,应该更大。更新规则为。同样,这将旋转超平面,使 和 之间的角度大于90 度数。这被反复迭代,超平面被旋转和调整,以使超平面法线的角度小于90度与类标记为1的数据点和大于90度与数据点标记为0 的类。
如果的量级很大,就会有很大的变化,因此在过程中会出现问题,并且可能需要更多的迭代才能收敛,具体取决于初始权重的大小。因此,标准化或标准化数据点是一个好主意。从这个角度来看,很容易直观地看到更新规则在做什么(将偏差视为超平面 Eq.1 的一部分)。现在将其扩展到更复杂的网络和/或具有阈值。
推荐阅读和参考:Neural Network, A Systematic Introduction by Raul Rojas:第四章
【讨论】: