【发布时间】:2017-12-25 14:16:57
【问题描述】:
这是我想通过使用RandomForest 包来使用随机森林的方式:
library (randomForest)
rf1 <- randomForest(CLA ~ ., dat, ntree=100, norm.votes=FALSE)
p1 <- predict(rf1, testing, type='response')
confMat_rf1 <- table(p1,testing_CLA$CLA)
accuracy_rf1 <- sum(diag(confMat_rf1))/sum(confMat_rf1)
我根本不想使用RandomForest 包。给定一个数据集(dat)并使用rpart 和randomforest 包的默认值,我怎样才能得到相同的结果?例如,对于 100 棵决策树,我需要运行以下命令:
for(i in 1:100){
cart.models[[i]]<-rpart(CLA~ ., data = random_dataset[[i]],cp=-1)
}
每个random_dataset[[i]] 将随机选择默认数量的属性和行。另外,rpart 是否用于randomforest?
【问题讨论】:
-
您是在问如何在仅给定决策树包的情况下进行随机森林?你为什么想做这个?这些软件包已经针对使用进行了优化。
-
沙洛姆@TimBiegeleisen,谢谢!我有几个原因。其中之一是向我的学生演示该过程,此外我想控制一些参数并更改一些算法。
-
如果你觉得很学术,你可以看看
randomForest的源代码。它不会像你想象的那么糟糕。在进入之前,请确保您了解通用算法。 -
我想在 R 环境中做,因为我需要使用 R 和其他包的更多功能。
-
@Avi,您可能会发现 this 对演示内容很有用
标签: r random-forest rpart