【问题标题】:How many features does the RandomForest algorithm select?RandomForest 算法选择了多少特征?
【发布时间】:2015-02-11 10:57:38
【问题描述】:

我正在使用随机森林,我想知道特征选择是如何工作的。 我有一组 423 个特征,我知道它们是使用 log2(F)+1 随机选择的。所以这样我得到了一个 12/13 的特征子集。但我无法理解的是选择的随机性以及这些子集对于每棵树是否应该不同,或者所有树的子集是否相同,但多重组合的不同之处在于。 如果我有一个包含 10 棵树的模型,那么特征选择是否应该因树而异?感谢您的帮助。

【问题讨论】:

标签: machine-learning random-forest feature-extraction


【解决方案1】:

森林中的每棵树都会获得不同的随机特征样本。决策树学习通常是确定性的,因此如果每棵树都具有相同的特征集,那么它们都会学习相同的决策树,这会达不到目的。您希望他们都接受不同特征子集的训练。

如果算法从 423 个特征的原始集合中选择 12 个特征的子集,那么每棵树都会从完整集合中获得自己的 12 个特征的样本(无需替换)。

【讨论】:

    猜你喜欢
    • 2017-08-17
    • 2012-07-09
    • 1970-01-01
    • 2017-06-13
    • 2011-01-05
    • 2012-02-06
    • 1970-01-01
    • 2011-07-10
    • 2018-01-08
    相关资源
    最近更新 更多