【发布时间】:2021-07-21 11:18:15
【问题描述】:
我正在使用 cross_val_score 和 KFold 在我的数据集上研究一些 cross_validation 分数
特别是我的代码如下所示:
cross_val_score(estimator=model, X=X, y=y, scoring='r2', cv=KFold(shuffle=True))
我的问题是将shuffle=True 放在KFold 中是否是一种常见行为:如果我这样做,则 r2 分数的回报是:
[0.5934, 0.60432, 0.45689, 0.6875, 0.5678]
如果我输入 shuffle=False 它会返回
[0.3987, 0,4576, 0.3234, 0.4567. 0.3233]
我不希望用于迭代训练的相同点在下一次被重新考虑,最终得到交叉验证的乐观分数。我应该如何解释我使用@987654329 获得了更好的分数@?
【问题讨论】:
标签: scikit-learn k-fold