【发布时间】:2019-08-17 23:48:30
【问题描述】:
我在 sklearn 中使用 RandomForestClassifier,并使用 GridsearchCV 获得最佳估算器。
我想知道当 GridsearchCV 中有许多具有相同分数的估计器(从简单到复杂的)时,GridsearchCV 的结果估计器是什么?最简单的?还是随机的?
【问题讨论】:
标签: scikit-learn random-forest gridsearchcv
我在 sklearn 中使用 RandomForestClassifier,并使用 GridsearchCV 获得最佳估算器。
我想知道当 GridsearchCV 中有许多具有相同分数的估计器(从简单到复杂的)时,GridsearchCV 的结果估计器是什么?最简单的?还是随机的?
【问题讨论】:
标签: scikit-learn random-forest gridsearchcv
GridSearchCV 不评估模型的复杂性(尽管这将是一个简洁的功能)。它也不会随机选择最佳模型。
相反,GridSearchCV 只是对存储的错误执行np.argmin()。参见source code中的对应行。
现在,根据NumPy docs,
如果最小值多次出现,则返回与第一次出现对应的索引。
也就是说,GridSearchCV 将始终选择最佳模型中的第一个。
【讨论】: