【发布时间】:2021-09-23 21:33:44
【问题描述】:
我使用'RandomizedSearchCV' 函数来估计随机森林模型的最佳参数。我可以使用'best_estimator_' 属性来预测我的测试数据吗?
我的问题是,在进行随机搜索时,部分数据将用于验证。那么最佳估计 RF 模型不会在整个数据集 rt 上进行训练吗?还是这一切都在幕后处理?
【问题讨论】:
标签: scikit-learn sklearn-pandas
我使用'RandomizedSearchCV' 函数来估计随机森林模型的最佳参数。我可以使用'best_estimator_' 属性来预测我的测试数据吗?
我的问题是,在进行随机搜索时,部分数据将用于验证。那么最佳估计 RF 模型不会在整个数据集 rt 上进行训练吗?还是这一切都在幕后处理?
【问题讨论】:
标签: scikit-learn sklearn-pandas
如文档cv.best_estimator_ 中所写,返回搜索选择的估计器,即给出最高分的估计器。
如果参数refit 设置为True(默认值),模型将使用整个数据集(包括验证)上的最佳参数重新拟合模型。因此,您可以简单地使用cv.best_estimator_ 来预测您的测试数据。
【讨论】: