使用 RBFKernel（C 和 gamma）优化 SMO答案

【问题标题】：Optimizing SMO with RBFKernel (C and gamma)使用 RBFKernel（C 和 gamma）优化 SMO
【发布时间】：2011-01-26 01:34:03
【问题描述】：

在支持向量机中使用 RBF 内核时有两个参数：C 和 γ。事先不知道哪个 C 和 γ 最适合一个问题；因此，必须进行某种模型选择（参数搜索）。目标是识别好的（C;γ），以便分类器可以准确地预测未知数据（即测试数据）。

weka.classifiers.meta.GridSearch 是用于调整一对参数的元分类器。然而，似乎需要很长时间才能完成（当数据集相当大时）。为了缩短完成这项任务所需的时间，您建议做什么？

根据A User's Guide to Support Vector Machines：

C : 软边距常数。较小的 C 值允许忽略靠近边界的点，并增加边距。

γ> 0是控制高斯宽度的参数

【问题讨论】：

标签： data-mining classification svm pentaho weka

【解决方案1】：

Hastie 等人的 SVMPath 探索了 C 的整个正则化路径，并且只需要与训练单个 SVM 模型大致相同的计算成本。从他们的论文中：

我们的 R 函数 SvmPath 计算混合示例中的所有 632 个步骤 (n+ = n− = 100，径向内核，γ = 1) 在奔腾 4、2Ghz linux 机器上 1.44(0.02) 秒；支持向量机函数（使用优化的代码 libsvm，来自 R 库 e1071）需要 9.28(0.06) 秒计算沿路径 10 个点的解。因此它需要我们的程序计算整个路径的时间比 libsvm 计算典型路径的时间多约 50% 单一解决方案。

他们在 R 中发布了该算法的 GPL 实现，您可以从 CRAN here 下载。

使用 SVMPath 应该可以让您快速找到任何给定 γ 的良好 C 值。但是，您仍然需要针对不同的 γ 值进行单独的训练。但是，这应该比为每对 C:γ 值分别运行快得多。

【讨论】：