【发布时间】:2019-01-30 15:58:08
【问题描述】:
我是数据科学的新手,我正在使用随机森林算法进行机器学习分析以执行分类。我的数据集中的目标变量称为 Attrition (Yes/No)。
我对如何在 Random Fores` 中生成这两个图有点困惑:
(1) Feature Importance Plot
(2) Decision Tree Plot
我了解随机森林是数据集中多个决策树模型的集合。
假设我的训练数据集称为TrainDf,我的测试数据集称为TestDf,我如何在 R 中创建这两个图?
更新:从这 2 个帖子看来,它们似乎无法完成,或者我在这里遗漏了什么? Why is Random Forest with a single tree much better than a Decision Tree classifier?
【问题讨论】:
-
为了绘制(伪)树结构,查看这个问题的答案:stats.stackexchange.com/questions/41443/…
-
决策树图在 RF 中没有意义,因为(顾名思义)有多个树,每个树都略有(或很多)不同。所以你不能制作一个单一的情节,除非你以某种方式平均所有这些树(不是很有用)。重要性图可以做,看这里的第一个答案。
-
OP 可能希望能够打印森林中的任何决策树,这可以通过
getTree函数完成 -
@RLave 我对您的链接所指的答案感到困惑。
标签: r machine-learning random-forest decision-tree feature-selection