【发布时间】:2016-05-08 13:44:56
【问题描述】:
R 中 randomForest 包中的 getTree 函数显示随机森林中使用的特定树的结构。
这是鸢尾花数据集上的示例
library(randomForest)
data(iris)
rf <- randomForest(Species ~ ., iris)
getTree(rf, 1)
这显示了 500 棵树 #1 的输出:
left daughter right daughter split var split point status prediction
1 2 3 3 2.50 1 0
2 0 0 0 0.00 -1 1
3 4 5 4 1.65 1 0
4 6 7 4 1.35 1 0
5 8 9 3 4.85 1 0
6 0 0 0 0.00 -1 2
7 10 11 2 3.10 1 0
8 12 13 4 1.55 1 0
9 0 0 0 0.00 -1 3
10 0 0 0 0.00 -1 3
11 0 0 0 0.00 -1 2
12 14 15 2 2.55 1 0
13 0 0 0 0.00 -1 2
14 16 17 2 2.35 1 0
15 0 0 0 0.00 -1 3
16 0 0 0 0.00 -1 3
17 0 0 0 0.00 -1 2
叶子是具有 0 个叶子女儿和 0 个右女儿的节点。
有没有一种方法可以获取这些叶子中的实例(虹膜数据集的行)?
就像节点 2 一样,它是一个叶子,它有来自 iris 数据集的实例 2,3,4 都归类为 1。
任何帮助将不胜感激。
【问题讨论】:
标签: r machine-learning random-forest feature-extraction feature-selection