【发布时间】:2016-06-01 05:32:51
【问题描述】:
我正在使用随机森林来解决回归问题,以预测给定 Test-X 集的 Test-Y 的标签值(新的特征值)。该模型已经在给定的 Train-X(特征)和 Train-Y(标签)上进行了训练。 R 的“randomForest”在预测 Test-Y 的数值方面非常有用。但这不是我想要的。
我想使用随机森林来生成概率密度函数,而不仅仅是一个数字。我搜索了几天的解决方案,到目前为止我找到了:
“randomForest”不会产生回归概率,而只会产生分类概率。 (通过“预测”并设置 type=prob)。
使用“quantregForest”提供了一种创建和可视化预测区间的好方法。但仍然不是概率密度函数!
对此还有其他想法吗?
【问题讨论】:
-
quantregForest确实提供了概率密度,它是您可以预测的ecdf。
标签: r random-forest probability-density