【问题标题】:Does feature order impact Decision tree algorithm in sklearn?特征顺序会影响 sklearn 中的决策树算法吗?
【发布时间】:2017-10-11 23:25:39
【问题描述】:

我读了一些资料:

但是,如果我更改功能顺序,我可以找到(功能名称集: 数据中的 [a,b,c] 变为 [b,a,c])。这真的会影响决策树的结果吗?

【问题讨论】:

    标签: machine-learning scikit-learn decision-tree


    【解决方案1】:

    不是真的。 Sklearn 通常使用购物车树,其中最佳分割是通过选择最小化成本函数的特征来决定的。所以列的顺序并不重要。

    【讨论】:

    • 谢谢,我有一个问题。如果数据太大(可能是 [10^6, 10^5])。第一次,我必须计算所有功能的最佳拆分器。那可能是O(n ^ 2)。这是非常缓慢的。这是正确的吗?
    • 是的,单个 CART 决策树需要扫描所有数据和所有特征以找到最佳拆分。通常您不会自己编写树代码,因为有许多优化的库可以很快为您完成这项工作。
    猜你喜欢
    • 2019-10-16
    • 2018-08-14
    • 2021-06-07
    • 2017-10-05
    • 2019-03-04
    • 2018-07-07
    • 2018-08-16
    • 2018-05-15
    • 1970-01-01
    相关资源
    最近更新 更多