【问题标题】:Optimizing SMO with RBFKernel (C and gamma)使用 RBFKernel(C 和 gamma)优化 SMO
【发布时间】:2011-01-26 01:34:03
【问题描述】:

在支持向量机中使用 RBF 内核时有两个参数:C 和 γ。事先不知道哪个 C 和 γ 最适合一个问题;因此,必须进行某种模型选择(参数搜索)。目标是识别好的(C;γ),以便分类器可以准确地预测未知数据(即测试数据)。

weka.classifiers.meta.GridSearch 是用于调整一对参数的元分类器。然而,似乎需要很长时间才能完成(当数据集相当大时)。为了缩短完成这项任务所需的时间,您建议做什么?

根据A User's Guide to Support Vector Machines

C : 软边距常数。较小的 C 值允许忽略靠近边界的点,并增加边距。

γ> 0是控制高斯宽度的参数

【问题讨论】:

    标签: data-mining classification svm pentaho weka


    【解决方案1】:

    Hastie 等人的 SVMPath 探索了 C 的整个正则化路径,并且只需要与训练单个 SVM 模型大致相同的计算成本。从他们的论文中:

    我们的 R 函数 SvmPath 计算混合示例中的所有 632 个步骤 (n+ = n− = 100,径向内核,γ = 1) 在奔腾 4、2Ghz linux 机器上 1.44(0.02) 秒;支持向量机 函数(使用优化的代码 libsvm,来自 R 库 e1071)需要 9.28(0.06) 秒计算沿路径 10 个点的解。因此它需要我们的程序 计算整个路径的时间比 libsvm 计算典型路径的时间多约 50% 单一解决方案。

    他们在 R 中发布了该算法的 GPL 实现,您可以从 CRAN here 下载。

    使用 SVMPath 应该可以让您快速找到任何给定 γ 的良好 C 值。但是,您仍然需要针对不同的 γ 值进行单独的训练。但是,这应该比为每对 C:γ 值分别运行快得多

    【讨论】:

      猜你喜欢
      • 2012-01-10
      • 2012-04-03
      • 2012-03-16
      • 1970-01-01
      • 1970-01-01
      • 2016-08-18
      • 1970-01-01
      • 2014-01-10
      • 1970-01-01
      相关资源
      最近更新 更多