【发布时间】:2020-02-06 03:46:49
【问题描述】:
我正在将使用 h20 和 r 的随机森林转换为使用 SciKit Learn 的随机森林分类器和 python 的随机森林。 H2o 的 randomForest 模型有一个参数“stopping_rounds”。有没有办法在 python 中使用 SKLearn 随机森林分类器模型来做到这一点?我已经查看了文档,所以恐怕我必须硬编码。
【问题讨论】:
标签: scikit-learn random-forest h2o
我正在将使用 h20 和 r 的随机森林转换为使用 SciKit Learn 的随机森林分类器和 python 的随机森林。 H2o 的 randomForest 模型有一个参数“stopping_rounds”。有没有办法在 python 中使用 SKLearn 随机森林分类器模型来做到这一点?我已经查看了文档,所以恐怕我必须硬编码。
【问题讨论】:
标签: scikit-learn random-forest h2o
不,我不相信 scikit-learn 算法有任何类型的自动提前停止机制(这就是 stopping_rounds 在 H2O 算法中所涉及的)。您将不得不手动计算出最佳的树数。
【讨论】:
根据sklearn random forest classifier docs,提前停止由min_impurity_split(已弃用)和min_impurity_decrease 参数确定。它似乎没有与 H2O 相同的功能,但它可能正是您想要的。
【讨论】: