SVM3 Soft Margin SVM

之前分为两部分讨论过SVM。第一部分讨论了线性SVM，并且针对线性不可分的数据，把原始的问题转化为对偶的SVM求解。http://www.cnblogs.com/futurehau/p/6143178.html

然后考虑到特征数量特别特别多的时候，引入核函数的求解。http://www.cnblogs.com/futurehau/p/6149558.html

但是，之前也遗留了一个问题，就是比如高斯核函数或其他的核函数，虽然large margin能够在一定程度上防止过拟合，但是加入你的核函数太过于powerful的话，还是很有可能带来overfit的问题。另一方面，之前都是基于hard Margin,就是要求你所有的数据都给我分正确，这很容易带来过拟合的问题。

所以，接下来就讨论soft margin来避免过拟合问题。简单来说soft margin就是允许模型犯一些的错误。

一、soft margin 的引入

　　如下图所示，我们把原来的hard margin转化为soft margin,允许你在一些点处犯错误，但是最小化的式子就需要改变，意思是你错误的点要尽可能的少。c是用来权衡soft margin和容许犯的错误大小的超参数。

　　 SVM3 Soft Margin SVM

　　稍微转化一下，表达式变为：

　　 SVM3 Soft Margin SVM

　　但是我们发现，这样一个表达式并不是一个QP问题的，因为取0取1这个的引入导致是非线性的，那么我们应该怎么转化呢？

　　这样思考，之前我们只考虑了分正确没，对于不正确的都一视同仁。我们可不可以改变一下呢？对于那些不正确的，如果离边界比较远的其实是大错误，如果离边界比较近的其实是小错误，这两类错误其实是应该区分开来的，所以引入新的表达式如下：

　　 SVM3 Soft Margin SVM

　　使用伊布c龙来记录违反的大小。表明你离我想要的值到底有多远。

　　这样，我们的问题就转化为：

　　 SVM3 Soft Margin SVM

　　观察这个表达式，其实也可以看为给定松弛因子做目标函数，给定一个L2的正则项。

　　 SVM3 Soft Margin SVM

二、soft margin 的 dual problem

　　好了，我们之前得到原始的soft margin 问题：

　　 SVM3 Soft Margin SVM

　　类似于之前的方法，我们需要把这个问题转换为对偶问题。

　　写出拉格朗日函数：

　　 SVM3 Soft Margin SVM

　　目标：

　　 SVM3 Soft Margin SVM

　　对伊布c隆求导得到：

　　 SVM3 Soft Margin SVM

　　带回原来表达式化简得到：

　　 SVM3 Soft Margin SVM

　　得到最终的表达式：

　　 SVM3 Soft Margin SVM

　　我们发现，最终的soft Margin dual problem的表达式和hard margin的表达式是内部是一样的，区别在于alpha的范围变化了。所以类似于之前的内部求偏导，我们可以得到：

　　 SVM3 Soft Margin SVM

　　对比之前，唯一的区别就是alpha的范围改变了。

三、参数b的计算与图形分析

　　3.1 b的求解

　　之前得到了几个参数,还差b。b的表达和之前有所不同，这里特别分析。

　　 SVM3 Soft Margin SVM

　　只有第二个等式C不等于alpha的时候才有确定的解，否则只能由kkt条件给出一个范围。

　　 SVM3 Soft Margin SVM

　　3.2 C的影响

　　 SVM3 Soft Margin SVM

　　3.3 alpha的物理意义

　　 SVM3 Soft Margin SVM

　　 SVM3 Soft Margin SVM

4. leave one out cross validation

　　还不太理解。

　　

　　

　　

相关文章：

2021-10-05
2021-08-31
2021-07-10
2021-09-05
2021-12-09
2021-11-03
2021-08-22
2021-09-04

猜你喜欢

2021-11-06
2021-04-28
2021-04-22
2022-12-23
2021-09-30
2021-08-20

相关资源

下载 2021-11-03
下载 2021-06-05
下载 2021-11-03
下载 2021-11-03

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode