如何使用 .fit() 进行交叉验证

【问题标题】：How to use .fit() with cross validation如何使用 .fit() 进行交叉验证
【发布时间】：2020-11-30 14:23:35
【问题描述】：

我对数据科学还很陌生，有点困惑。并且只是想确保我的方法有意义。

我创建的模型如下：

lr7 = GaussianNB().fit(X_train,y_train)

并在之后使用 cross_val_predict()。

y_pred8 = cross_val_predict(lr8, X_test, y_test, cv=5, n_jobs=-1, verbose=5)

首先交叉验证训练集不是更有意义吗？

scikitlearn 中还有一个cross_validate()函数。将这个与火车数据集一起使用是否正确？在文档中，他们同时使用 X 和 y，而不是训练/测试拆分数据。

【问题讨论】：

【解决方案1】：

实现交叉验证的一种简单方法是使用 cross_val_score 函数（来自 sklearn。这可能适合您的问题。

# build model
lr7 = GaussianNB()
scores = cross_val_score(lr7, X, y, cv=5)

请注意，在交叉验证中，您可以使用整个数据集或训练部分 X_train、y_train，但不要使用代码中显示的测试部分。

【讨论】：