【发布时间】:2015-11-13 09:08:32
【问题描述】:
我在使用决策树 (CART) 进行预测时遇到问题。
我有这个代码:
training <- read.csv("pml-training.csv", header=TRUE)
set.seed(1972)
inTrain <- createDataPartition(y=training2$classe, p=0.6, list=FALSE)
wk_training <- training2[inTrain,]
wk_testing <- training2[-inTrain,]
wk_trainng 数据集有 11776 个变量和 wk_testing 7846。
set.seed(1972)
model_dt <- train(wk_training$classe ~ ., data = wk_training, method="rpart")
print(model_dt, digits=3)
针对 wk_testing 运行
predictions_dt <- predict(model_dt, newdata=wk_testing)
然后我希望 predictions_dt 有 7846 行,因为它有 wk_testing, 但是 predictions_dt 只有 165 行????
我不知道我做错了什么......
谁能帮帮我?
提前致谢
【问题讨论】:
-
您的代码中在哪里定义了
training2变量?您是否可能在代码中打错字并使用了错误的变量? -
我从这样的训练中创建 training2: nzv
标签: prediction r-caret rpart