【发布时间】:2020-11-30 14:23:35
【问题描述】:
我对数据科学还很陌生,有点困惑。 并且只是想确保我的方法有意义。
我创建的模型如下:
lr7 = GaussianNB().fit(X_train,y_train)
并在之后使用 cross_val_predict()。
y_pred8 = cross_val_predict(lr8, X_test, y_test, cv=5, n_jobs=-1, verbose=5)
首先交叉验证训练集不是更有意义吗?
scikitlearn 中还有一个cross_validate()函数。
将这个与火车数据集一起使用是否正确?在文档中,他们同时使用 X 和 y,而不是训练/测试拆分数据。
【问题讨论】:
-
我们从不交叉验证 test 集。
标签: scikit-learn cross-validation