【发布时间】:2021-09-16 02:07:54
【问题描述】:
我需要使用 LinearSVC 训练 SVM 模型,并使用内部 2 折 Gridsearch 进行 10 折交叉验证以优化 gamma 和 C。但我还必须对我的数据应用 PCA 以减小其大小。 我应该在模型的 CV 和训练发生的循环之前还是在循环中应用 PCA? 在后一种情况下,每个循环我会有不同数量的主成分,但这有缺点吗?
【问题讨论】:
-
创建一个执行
GridSearch{Pipeline[PCA->SVM]}的管道 -
我投票结束这个问题,因为它与 help center 中定义的编程无关,而是关于 ML 理论和/或方法 - 请参阅
machine-learning@ 中的介绍和注意事项987654322@. -
你最好把它贴在这里:datascience.stackexchange.com
-
不清楚为什么您有内部 2 折网格搜索。对我来说,你应该 1/ 做 PCA,2/ 做 Gridsearch 优化和 3/ 10 倍交叉验证来获得度量指标,但是如果没有这个,gridsearch 可能会给出一个很好的结果。
标签: machine-learning scikit-learn svm pca