如果我们在 SVM 中使用内核，为什么需要软边距？ [复制]答案

【问题标题】：Why do we need a soft-margin if we are using a kernel in SVM? [duplicate]如果我们在 SVM 中使用内核，为什么需要软边距？ [复制]
【发布时间】：2014-06-01 20:39:37
【问题描述】：

我知道在 SVM 中使用内核的想法是将数据点转换为无限维空间，其中点可以线性可分。这样我们就可以找到分隔点的最大边距。但是，如果我们能够分离所有点，为什么我们需要使用软边距呢？！据我所知，软边距背后的想法是，如果我们不能完全分离所有点，那么我们会找到最佳边距。因此，如果我们使用内核函数，那么软边距的整个想法对我来说毫无意义。那是什么想法？！

【问题讨论】：

不确定是否重复。这是一种不同的方式来询问哪个得到相同的答案

标签： algorithm machine-learning data-mining

【解决方案1】：

即使您能够创建完美拟合的分离超平面，它也可能过于复杂，因此容易出现Overfitting。 SVM 的优点之一是软边距公式很自然地提供了在精度和泛化之间进行缩放的可能性。

【讨论】：

查看这个问题stackoverflow.com/questions/4629505/svm-hard-or-soft-margins 以获得对不完全相同但相关的问题的更详细的答案

【解决方案2】：

您可能有具有不同标签的重复项。那么很明显，您找不到分离数据的平面。

Class A:  (3,3) (2,2) (1,1)
Class B:  (0,0) (1,1) (2,2)

软边距仍然会在矛盾的数据集上产生合理的结果。实际上，数据表现不佳，并且内核技巧不能总是使其线性可分。有些数据很难分离。

【讨论】：