【发布时间】:2015-02-11 10:57:38
【问题描述】:
我正在使用随机森林,我想知道特征选择是如何工作的。 我有一组 423 个特征,我知道它们是使用 log2(F)+1 随机选择的。所以这样我得到了一个 12/13 的特征子集。但我无法理解的是选择的随机性以及这些子集对于每棵树是否应该不同,或者所有树的子集是否相同,但多重组合的不同之处在于。 如果我有一个包含 10 棵树的模型,那么特征选择是否应该因树而异?感谢您的帮助。
【问题讨论】:
-
也许你应该看看这篇论文:montefiore.ulg.ac.be/~glouppe/pdf/phd-thesis.pdf
标签: machine-learning random-forest feature-extraction