【发布时间】:2022-01-15 21:07:23
【问题描述】:
我有 15 个不同的数据集(包含 15 个pandas.DataFrame)的相同问题,我想从单个分类器的角度进行 K-Fold CV 研究。目前,我正在使用以下结构进行一些实验:
# Manual 15-Fold CV
for i in range(len(datasets)):
train_sets = [datasets[j] for j in range(len(datasets)) if j != i]
test_set = datasets[i]
train = pd.concat(train_sets)
clf = ...
clf.fit(...)
...
如您所见,我需要将每个数据集视为 K-Fold 的折叠,而不是简单地将所有数据集合并为一个并运行默认的 cross_val_score() 或类似的东西。
这在运行单一实验时效果很好,但我想使用GridSearchCV 来更好地探索我的模型。所以,问题是:有没有办法创建一个自定义的KFold,预先定义每个折叠的内容并将其传递给GridSearchCV?
【问题讨论】:
标签: python pandas machine-learning scikit-learn data-mining