【发布时间】:2017-10-02 00:53:11
【问题描述】:
我将我的训练集划分为分层的 k-folds,如下所示:
n_folds = 5
skf = list(StratifiedKFold(y, n_folds, random_state=SEED))
for k, (train, test) in enumerate(skf):
X_train = X[train]
y_train = y[train]
X_val = X[test]
y_val = y[test]
clf.fit(X_train, y_train)
preds = clf.predict_proba(X_val)
前 4 折的分类准确率符合预期。 最后一折的准确性明显较差。
我尝试改变 SEED 和 n_folds 的值,在所有情况下,最后一折总是最差的(5 折,大约 3%)。为什么会这样?
谢谢。
【问题讨论】:
-
可能会降低你的学习率。
标签: python machine-learning scikit-learn cross-validation