【发布时间】:2015-07-14 10:57:33
【问题描述】:
我有一个不平衡的数据集,因此我有一个仅在数据训练期间应用的过采样策略。我想使用像GridSearchCV 或cross_val_score 这样的scikit-learn 类来探索或交叉验证我的估计器(例如SVC)上的一些参数。但是我看到您要么传递了 cv 折叠的数量,要么传递了标准的交叉验证生成器。
我想创建一个自定义 cv 生成器,这样我得到并分层 5 倍并仅对我的训练数据(4 倍)进行过采样,并让 scikit-learn 浏览我的估计器的参数网格并使用剩余的倍数进行评分进行验证。
【问题讨论】:
-
你找到解决方案了吗?
-
是的,我这周会发布。
-
谢谢!请发帖,以帮助像我这样的人:p
-
我真的很想看看你的解决方案,我也坚持这个。
标签: python validation scikit-learn svm