【发布时间】:2020-01-02 04:33:25
【问题描述】:
sklearn.model_selection.GridSearchCV 的文档说
搜索选择的估计器,即在遗漏数据上给出最高分数(或最小损失,如果指定)的估计器。如果 refit=False 则不可用。
...
选择的参数是那些最大化遗漏数据得分的参数,除非传递了明确的分数,在这种情况下使用它来代替。
什么是“遗漏数据”?它是交叉验证的遗漏部分,例如数据集的 1/10?
sklearn.model_selection.GridSearchCV 是如何遗漏数据的?
【问题讨论】:
-
不完全确定如果我是正确的,但如果我没记错的话,遗漏的数据是用于交叉验证的数据,它是从总数据中随机拆分出来的。不过,通常你会使用更多 25% 的数据进行交叉验证。
标签: python machine-learning scikit-learn