1.样本集

D=(x1,y1),(x2,y2),(x3,y3),(x4,y4),...,(xm,ym) D = {(x_1,y_1),(x_2,y_2),(x_3,y_3),(x_4,y_4),...,(x_m,y_m)}

2.目标函数

寻找最优超平面将不同类别的样本分开。
wTx+b=0 w^Tx + b = 0
ww 为法向量,bb为位移项。

如果超平面将样本成功分类,则下式成立:
{wTxi+b+1,yi=+1wTxi+b1,yi=1 \{\begin{array}{l} w^Tx_i+b\geqslant+1, y_i=+1 \\ w^Tx_i+b\geqslant-1, y_i=-1 \end{array}
使等号成立的样本点成为支持向量。

任意点x到超平面的距离:
γ=wTx+bw1w \gamma = \frac{|w^Tx + b|}{||w||} \ge \frac{1}{||w||}
整个margin的宽度:
γ=2w \gamma = \frac{2}{||w||}
得到基本的目标函数
arg maxw,b2w \arg\,\max_{w, b}\frac{2}{||w||}

s.t.  yi(wTxi+b)1,  i=1,2,...,N s.t.\; y_i(w^Tx_i + b) \ge 1,\;i = 1, 2, ..., N

对目标函数变化
arg minw,b12w2 \arg\,\min_{w, b}\frac{1}{2}||w||^2

s.t.  yi(wTxi+b)1,  i=1,2,...,N s.t.\; y_i(w^Tx_i + b) \ge 1,\;i = 1, 2, ..., N

引入拉格朗日乘子
L(w,b,α)=12w2+iαi[1yi(wTxi+b)] L(w, b, \alpha) = \frac{1}{2}||w||^2 + \sum_i \alpha_i[1 - y_i(w^Tx_i + b)]

wwbb 求导
Lw=wiαiyixi=0  w=iαiyixi \frac{\partial{L}}{\partial{w}} = w - \sum_i \alpha_iy_ix_i = 0 \; \Rightarrow w = \sum_i \alpha_iy_ix_i

Lb=iαiyi=0 \frac{\partial{L}}{\partial{b}} = \sum_i \alpha_iy_i = 0

将w,b带入

【公式推导】2.SVM

至此目标函数完成:
arg maxα(iαi12ijαiαjyiyjxiTxj) \arg\,\max_\alpha (\sum_i\alpha_i -\frac{1}{2}\sum_i\sum_j\alpha_i\alpha_jy_iy_jx_i^Tx_j)

s.t.  iαiyi=0 s.t. \; \sum_i \alpha_iy_i = 0

αi0,i=1,2,...,N \alpha_i\ge 0, i = 1,2,...,N

αi0,i=1,2,...,N \alpha_i\ge 0, i = 1,2,...,N

求出结果
w=iαiyixi w^* = \sum_i \alpha_i^*y_ix_i

相关文章: