【发布时间】:2016-10-08 01:16:56
【问题描述】:
我正在寻找一个 python 或 R 中的随机森林包,它可以让我获得关于最终构建的森林的一些细粒度的细节。特别是,我想:
- 获取创建的树的一些表示;
- 对于森林中的每棵树,获取其与数据拟合程度的总体度量(如熵);
- 对于训练集中的每条记录和森林中的每棵树,记录它最终位于哪个终端叶;和
- 对于新记录,对于森林中的每棵树,记录它最终位于哪个末端叶子中。
我意识到 (4) 的解决方案也可以作为 (3) 的解决方案,但我猜测 (3) 应该相对容易通过在森林生长时密切关注结果来实现。
我非常努力地研究了 R 和 python 中的可用选项,但我找不到满足所有这四个要求的现成例程。 (很难找到一个满足条件(1)的,让你直接看到森林。)
如果有人知道我错过了什么,或者自己构建了这样的例程,我非常想要一个链接/参考。
【问题讨论】:
标签: python r machine-learning random-forest