【发布时间】:2019-05-12 05:44:56
【问题描述】:
我有一个这样的数据框:
Col1 Col2
10 1 6
11 3 8
12 9 4
13 7 2
14 4 3
15 2 9
16 6 7
17 8 1
18 5 5
我想使用 KFold 交叉验证来拟合我的模型并进行预测。
for train_index, test_index in kf.split(X_train, y_train):
model.fit(X[train_index], y[train_index])
y_pred = model.predict(X[test_index])
此代码生成以下错误:
'[1 2 4 7] 不在索引中'
我看到在 KFold.split() 之后,train_index 和 test_index 不使用数据帧的真实索引号。
所以我无法适应我的模型。
有人有想法吗?
【问题讨论】:
-
我已经对此进行了测试,但这并没有解决我的错误。正如我所说,我的错误在于合适的部分。当我尝试使用
.loc时,使用的索引不是我数据框的真正索引。由于我的数据框中不存在索引,它用NaN填充值 -
好的,重新打开。不知道。
标签: python pandas cross-validation