【发布时间】:2018-02-04 19:28:12
【问题描述】:
我有一个数据框,其中有一列给出集群,我想在训练中执行具有相同分数的 kfold,并在每个集群中进行测试。
我知道我可以使用以下代码自己完成:
nb_fold = 10
for i in range(nb_fold):
X_train= X.groupby('Cluster').apply(lambda x: x.sample(frac = 1/nb_fold))
X_train.index = temp.index.droplevel(0)
Y_train = Y.loc[X_train.index]
X_eval, Y_eval = X.drop(X_train.index), Y.drop(Y_train.index)
但我想知道是否有一个 scikit learn 包装器,因为它会进行有替换的平局,而我可以使用没有替换的平局。
【问题讨论】:
标签: python pandas scikit-learn cross-validation