插入符号包中决策树的预测问题答案

【问题标题】：Problems with prediction in decision tree in caret package插入符号包中决策树的预测问题
【发布时间】：2015-11-13 09:08:32
【问题描述】：

我在使用决策树 (CART) 进行预测时遇到问题。

我有这个代码：

training <- read.csv("pml-training.csv", header=TRUE)
set.seed(1972)
inTrain <- createDataPartition(y=training2$classe, p=0.6, list=FALSE)
wk_training <- training2[inTrain,]
wk_testing <- training2[-inTrain,]

wk_trainng 数据集有 11776 个变量和 wk_testing 7846。

set.seed(1972)
model_dt <- train(wk_training$classe ~ ., data = wk_training,  method="rpart")
print(model_dt, digits=3)

针对 wk_testing 运行

predictions_dt <- predict(model_dt, newdata=wk_testing)

然后我希望 predictions_dt 有 7846 行，因为它有 wk_testing，但是 predictions_dt 只有 165 行？？？？

我不知道我做错了什么......

谁能帮帮我？

提前致谢

【问题讨论】：

您的代码中在哪里定义了training2 变量？您是否可能在代码中打错字并使用了错误的变量？
我从这样的训练中创建 training2： nzv

标签： prediction r-caret rpart

【解决方案1】：

如果您有缺失值，predict 函数默认为na.action = na.omit。您可以使用na.action = na.fail 进行测试以查看这是否是问题所在。如果是这种情况，您可能需要估算。请参阅train 中的preProcess 选项。

【讨论】：