【发布时间】:2023-04-01 15:07:01
【问题描述】:
我正在使用 R 中的 rpart 进行分类。树模型由以下人员训练:
> tree <- rpart(activity ~ . , data=trainData)
> pData1 <- predict(tree, testData, type="class")
这个树模型的准确率是:
> sum(testData$activity==pData1)/length(pData1)
[1] 0.8094276
我阅读了tutorial 以通过交叉验证来修剪树:
> ptree <- prune(tree,cp=tree$cptable[which.min(tree$cptable[,"xerror"]),"CP"])
> pData2 <- predict(ptree, testData, type="class")
剪枝树的准确率还是一样的:
> sum(testData$activity==pData2)/length(pData2)
[1] 0.8094276
我想知道我修剪过的树有什么问题?以及如何在 R 中使用交叉验证来修剪树模型?谢谢。
【问题讨论】:
标签: r machine-learning decision-tree rpart