机器学习技法-01-2-Large-Margin Separating Hyperplane

distance to hyperplane

和之前不太一样的是，之前的会补上x0=1，这里是把w0单独拿出来，w0,(w1,w2,w3…wd)，w0是截距。

b就是hyperplane函数的常数项，w1x1+w2x2+b=0的形式。其中b=w0。

可以表示hyperplane平面上的任意一个向量，所以w会垂直于hyperplane这个平面。w是这个平面的法向量。

distance最大也就是，xn与超平面上的的向量，在与hyperplane垂直方向上（也就是w的方向上）的投影。

xn-就代表：xn和形成的向量。

上面的绝对值可以用来代替，因为乘上yn以后就一定会大于0，和绝对值的作用是相同的。

机器学习技法-01-2-Large-Margin Separating Hyperplane

min函数要求最小值比较难，可以进行适当地缩放，把最小值为1缩放成>=1。

那么会不会在缩放之后无法取到最小值1呢？

不会的。举个例子，

假设此时的（b,w）是最优的，并且取不到1，大于1。比如说大于1.126，w需要缩放到除以w/1.126，那么此时的

还会变大，与最优的（b,w）对应最大的margin(b,w)相矛盾，所以就算进行了缩放，也不会有影响，最小值还是1。

再对上面的式子进行改进，得到了下面最终的结果。

机器学习技法-01-2-Large-Margin Separating Hyperplane

直接使用这个公式就可以了。，在w的方向上的投影。