《常用的机器学习算法——SVM浅析》

1、线性可分的SVM和硬间隔（Hard Margin）最大化
2、线性可分的SVM和软间隔（Soft Margin）最大化
3、非线性SVM与核函数
4、SMO算法

ch1、线性可分的SVM和硬间隔最大化

1、问题描述

1）问题描述：给定一系列的样本（x1,y1）,（x2,y2）,…,（xn,yn）,其中xi是m维向量，yi属于{-1,+1}。
2）最终目的：找到一个分隔面w*x+b=0，判别函数f(x)=sign(w*x+b)；使得能够将样本集中的数据正确划分；
3）存在问题：存在多个满足上述分隔条件的超平面。
4）解决思路：要引入间隔最大化的约束。间隔指的是最近（样本）点到分隔平面距离的两倍。

2、函数间隔与几何间隔

1）函数间隔：

《常用的机器学习算法——SVM浅析》
函数的间隔可以表示分类预测的正确性及确信度。但是函数的间隔当w和b成比例（2倍）增加的时候，超平面并没有改变，而函数间隔却变成了2倍。所以要进行规范化。令||w||=1；

2）几何间隔

《常用的机器学习算法——SVM浅析》

所以由上述公式可以知道函数间隔与几何间隔之间的关系：
《常用的机器学习算法——SVM浅析》

3、间隔最大化

支持向量机的基本思想是：能够正确划分样本集并且几何间隔最大的超平面。引出约束的最优化问题：
《常用的机器学习算法——SVM浅析》

上述也提到随着w，b缩放尺度的改变，函数间隔也是成倍改变的，现在令函数间隔为1；则优化问题等价于
等价于：
《常用的机器学习算法——SVM浅析》

这是一个凸二次规划问题。
引入几个概念：
1）凸集：
一个点集（或区域），如果连接其中任意两点x1，x2的线段都全部包含在该集合内，称该点集为凸集，否则为非凸集。

《常用的机器学习算法——SVM浅析》
2）凸性条件：
（1）.根据一阶导数（函数的梯度）来判断函数的凸性：
设f(x)为定义在凸集R上，且具有连续的一阶导数的函数，则f(x)在R上为凸函数的充要条件是对凸集R内任意不同两点 1 ，不等式
《常用的机器学习算法——SVM浅析》
恒成立。
（2）.根据二阶导数（ Hesse矩阵)来判断函数的凸性
设f(x)为定义在凸集R上且具有连续二阶导数的函数，则f(x)在R上为凸函数的充要条件： Hesse矩阵在R上处处半正定.