【问题标题】:What is equivalent of "max depth" in the 'R' package "ranger"?“R”包“游侠”中的“最大深度”相当于什么?
【发布时间】:2017-05-31 17:58:10
【问题描述】:

其他随机森林工具具有限制特定分支上最大分割深度的“刻度盘”。

例如,h2o.randomForest 有“max_depth”。

“游侠”的版本是什么?

【问题讨论】:

    标签: r random-forest


    【解决方案1】:

    我不熟悉h2o.randomForest 包,但我对随机森林的一般理解是,每棵树都会不断生长,直到树的每片叶子中包含一定的最小数据点数。换句话说,一棵树会不断分裂,直到每个数据点达到一定的分类级别。在标准的randomForest 包中,有一个名为nodesize 的参数控制它:

    https://stats.stackexchange.com/questions/158583/what-does-node-size-refer-to-in-the-random-forest

    ranger 包中的类似参数似乎是min.node.size。您可以将上面链接中的信息与documentation 进行比较,以说服自己他们都在讨论同一件事。

    【讨论】:

    • 最大深度是关于树桩和叶子之间的分割数。它是一个控制参数,用于避免过拟合。
    • @EngrStudent 我不认为过度拟合是随机森林的一个大问题。在任何情况下,节点大小都可以让您对拆分进行相同的控制。
    • 任何东西都可能过拟合。这不是最大的问题,但如果你想调优性能,那么你必须调优。如果您限制为二叉树进行的拆分次数,那么您可以设置计算时间的上限。
    • 我对随机森林的理解是它们相对不容易过拟合,但也许我错了。在任何情况下,控制节点大小都应该给您与控制拆分数量相同的控制权。
    猜你喜欢
    • 2020-10-02
    • 2015-10-11
    • 2015-01-08
    • 1970-01-01
    • 1970-01-01
    • 2015-04-23
    • 1970-01-01
    • 1970-01-01
    • 2019-10-01
    相关资源
    最近更新 更多