【发布时间】:2021-08-29 13:21:27
【问题描述】:
我正在做一个二元分类。请问在进行K折交叉验证时,如何提取训练数据框的错误分类或分类实例的真实索引?我没有找到这个问题的答案here。
如here 所述,我得到了折叠中的值:
skf=StratifiedKFold(n_splits=10,random_state=111,shuffle=False)
cv_results = cross_val_score(model, X_train, y_train, cv=skf, scoring='roc_auc')
fold_pred = [pred[j] for i, j in skf.split(X_train,y_train)]
fold_pred
有什么方法可以获取错误分类(或分类)的索引吗?所以输出是一个数据框,在进行交叉验证时只有错误分类(或分类)的实例。
期望的输出: 数据帧中具有真实索引的错误分类实例。
col1 col2 col3 col4 target
13 0 1 0 0 0
14 0 1 0 0 0
18 0 1 0 0 1
22 0 1 0 0 0
输入有 100 个实例,其中 4 个在进行 CV 时被错误分类(索引号 13、14、18 和 22)
【问题讨论】:
标签: python classification cross-validation training-data indices