distance to hyperplane
和之前不太一样的是,之前的会补上x0=1,这里是把w0单独拿出来,w0,(w1,w2,w3…wd),w0是截距。
b就是hyperplane函数的常数项,w1x1+w2x2+b=0的形式。其中b=w0。
可以表示hyperplane平面上的任意一个向量,所以w会垂直于hyperplane这个平面。w是这个平面的法向量。
distance最大也就是,xn与超平面上的的向量,在与hyperplane垂直方向上(也就是w的方向上)的投影。
xn-就代表:xn和
形成的向量。
上面的绝对值可以用
来代替,因为乘上yn以后就一定会大于0,和绝对值的作用是相同的。
min函数要求最小值比较难,可以进行适当地缩放,把最小值为1缩放成>=1。
那么会不会在缩放之后无法取到最小值1呢?
不会的。举个例子,
假设此时的(b,w)是最优的,并且取不到1,大于1。比如说大于1.126,w需要缩放到除以w/1.126,那么此时的
还会变大,与最优的(b,w)对应最大的margin(b,w)相矛盾,所以就算进行了缩放,也不会有影响,最小值还是1。
再对上面的式子进行改进,得到了下面最终的结果。
直接使用这个公式就可以了。,在w的方向上的投影。