【发布时间】:2017-10-12 18:52:27
【问题描述】:
理论将数据集分为三组:用于训练模型的训练集、用于调整参数的验证集和用于评估性能的测试集。
但是,已经有 GridSearchCV 对训练集进行交叉验证以找到最佳参数。但是如何使用自己的验证集来调整参数?
我有 10 个类,对于训练数据,每个类有 1017 个样本。 在验证和测试集中,每个类有 300 个样本。
我已经在火车数据上训练了我的分类。
clf = RandomForestClassifier(random_state=97)
clf.fit(train, np.array(train_lab))
如何使用我的验证集调整参数?我发现仅使用 GridSearchCV 作为交叉验证的示例。但是我想避免它并在我自己的验证集上调整模型。我该怎么做?
【问题讨论】:
-
使用 GridSearchCV,我相信每次迭代中的遗漏集都可以视为您的验证集。如果您想使用自己的验证集,请不要使用 GridSearchCV,只需自己编写代码即可(这很容易)。
标签: python scikit-learn