线性支持向量机 (Linear-SVM) 被用于线性可分的数据集的二分类问题,当数据集不是线性可分的时候,需要利用到核函数将数据集映射到高维空间。这样数据在高维空间中就线性可分。

1 高斯核函数定义

高斯核函数(Gaussian kernel),也称径向基 (RBF) 函数,是常用的一种核函数。它可以将有限维数据映射到高维空间,我们来看一下高斯核函数的定义:
k(x,x)=exx22δ2k(x,x')=e^{-\frac{||x-x'||^2}{2\delta ^2}}

上述公式涉及到两个向量的欧式距离(2范数)计算,而且,高斯核函数是两个向量欧式距离的单调函数。σ 是带宽,控制径向作用范围,换句话说,σ 控制高斯核函数的局部作用范围。当x 和x′ 的欧式距离处于某一个区间范围内的时候(也可看作样本距离或特征距离),假设固定x′,k(x,x′) 随x的变化而变化的相当显著。

2 一维情况

令x′=0,k(x,0) 随x的变化情况如下图所示:
σ=1
高斯核函数【转载】
σ=5
高斯核函数【转载】
我们看到,随着x与x′的距离的距离的增大,其高斯核函数值在单调递减。并且,σ越大,那么高斯核函数的局部影响范围就会越大。

3 二维情况

σ=1
高斯核函数【转载】
σ=5
高斯核函数【转载】
二维可以更加明显的看出高斯核函数局部作用的范围随带通的变化情况。带通越大,高斯核函数的局部影响的范围就越大。在超出这个范围之后,核函数的值几乎不变。

3 高斯核将数据映射到高维甚至无穷维的原理

通过一些简单的推导,我们可以得到这样的结果,为了描述简单,我们令高斯核中的分母为1.
高斯核函数【转载】
图片来自:知乎提问

可以看到,高斯核函数通过泰勒展开可以被描述成ϕ(x)Tϕ(x)ϕ(x)^Tϕ(x′)的形式,而ϕ(x)ϕ(x)是无穷维的。


以上内容来自:

相关文章:

  • 2022-12-23
  • 2021-11-23
  • 2022-12-23
  • 2022-02-07
  • 2021-11-01
  • 2021-11-23
  • 2022-01-07
  • 2022-12-23
猜你喜欢
  • 2022-12-23
  • 2021-07-16
  • 2021-11-23
  • 2021-12-03
  • 2021-08-17
相关资源
相似解决方案