核方法 

核方法 是一类把低维空间的非线性可分问题,转化为高维空间的线性可分问题的方法。核方法不仅仅用于SVM,还可以用于其他数据为非线性可分的算法。核方法的理论基础是Cover's theorem,指的是对于非线性可分的训练集,可以大概率通过将其非线性映射到一个高维空间来转化成线性可分的训练集。

SVM中,令 核函数基础二 核方法、核技巧和核函数 表示将 核函数基础二 核方法、核技巧和核函数 映射后的线性向量,那么对偶问题是:

核函数基础二 核方法、核技巧和核函数

最终分类模型是:

核函数基础二 核方法、核技巧和核函数

跟上一篇的SVM相比,除了 核函数基础二 核方法、核技巧和核函数 变成了 核函数基础二 核方法、核技巧和核函数 ,其他式子没有任何变化。

到这里核方法已经初步结束了,如果知道 核函数基础二 核方法、核技巧和核函数 的具体形式就可以直接拿来用了。不过再深入一步,可以用核技巧加速核方法的计算。观察 核函数基础二 核方法、核技巧和核函数 ,我们只需要计算 核函数基础二 核方法、核技巧和核函数 ,并不需要单独计算,这便引入了核函数的概念。

核函数 

定义 核函数[2] 设 核函数基础二 核方法、核技巧和核函数 是输入空间(即 核函数基础二 核方法、核技巧和核函数 , 核函数基础二 核方法、核技巧和核函数 是 核函数基础二 核方法、核技巧和核函数 的子集或离散集合 ),又设 核函数基础二 核方法、核技巧和核函数 为特征空间(​ 核函数基础二 核方法、核技巧和核函数 是希尔伯特空间[3]),如果存在一个从 核函数基础二 核方法、核技巧和核函数 到 核函数基础二 核方法、核技巧和核函数 的映射

核函数基础二 核方法、核技巧和核函数

使得对所有 核函数基础二 核方法、核技巧和核函数 ,函数 核函数基础二 核方法、核技巧和核函数 满足条件

核函数基础二 核方法、核技巧和核函数

则称 核函数基础二 核方法、核技巧和核函数 为核函数。其中 核函数基础二 核方法、核技巧和核函数 为映射函数, 核函数基础二 核方法、核技巧和核函数 为内积。

即核函数输入两个向量,它返回的值跟两个向量分别作 核函数基础二 核方法、核技巧和核函数 映射然后点积的结果相同。

核技巧

核技巧是一种利用核函数直接计算 核函数基础二 核方法、核技巧和核函数 ,以避开分别计算 核函数基础二 核方法、核技巧和核函数 和 核函数基础二 核方法、核技巧和核函数 ,从而加速核方法计算的技巧。

得益于SVM对偶问题的表现形式,核技巧可以应用于SVM。 核函数基础二 核方法、核技巧和核函数 可改写为:

核函数基础二 核方法、核技巧和核函数

核函数基础二 核方法、核技巧和核函数 可改写为:

核函数基础二 核方法、核技巧和核函数

核函数的选择是SVM的最大变数,如果核函数选择不适,那么 核函数基础二 核方法、核技巧和核函数 将不能将输入空间映射到线性可分的特征空间。下表为常用核函数[4]:

核函数基础二 核方法、核技巧和核函数

不知道 核函数基础二 核方法、核技巧和核函数 的情况下,如何判断某个 核函数基础二 核方法、核技巧和核函数 是不是核函数?答案是 核函数基础二 核方法、核技巧和核函数 是核函数当且仅当对任意数据 核函数基础二 核方法、核技巧和核函数 ,核矩阵(kernal matrix,gram matrix)总是半正定的[5]:

核函数基础二 核方法、核技巧和核函数

总结:核方法是一类把低维空间的非线性可分问题,转化为高维空间的线性可分问题的方法。核函数输入两个向量,它返回的值跟两个向量分别作 核函数基础二 核方法、核技巧和核函数 映射然后点积的结果相同。核技巧是一种利用核函数直接计算 核函数基础二 核方法、核技巧和核函数 ,以避开分别计算 核函数基础二 核方法、核技巧和核函数 和 核函数基础二 核方法、核技巧和核函数 ,从而加速核方法计算的技巧。核方法不仅仅适用于SVM,还适用于其他数据为非线性可分的问题和算法。SVM的表现形式包含了映射的点积,所以可以用核技巧加速核方法的计算。

 

[1] 本文主干内容来自Machine-Learning-Session 

[2] 《统计学习方法》定义7.6

[3] 希尔伯特空间是完备的(对极限封闭)、被赋予内积的(对称性、正定性、线性)线性空间。

[4] 《机器学习》表6.1

[5] 证明见《统计机器学习》定理7.5

相关文章:

猜你喜欢
  • 2022-01-19
  • 2021-05-10
  • 2021-07-16
  • 2021-05-24
相关资源
相似解决方案