【问题标题】:Problems with prediction in decision tree in caret package插入符号包中决策树的预测问题
【发布时间】:2015-11-13 09:08:32
【问题描述】:

我在使用决策树 (CART) 进行预测时遇到问题。

我有这个代码:

training <- read.csv("pml-training.csv", header=TRUE)
set.seed(1972)
inTrain <- createDataPartition(y=training2$classe, p=0.6, list=FALSE)
wk_training <- training2[inTrain,]
wk_testing <- training2[-inTrain,]

wk_trainng 数据集有 11776 个变量和 wk_testing 7846。

set.seed(1972)
model_dt <- train(wk_training$classe ~ ., data = wk_training,  method="rpart")
print(model_dt, digits=3)

针对 wk_testing 运行

predictions_dt <- predict(model_dt, newdata=wk_testing)

然后我希望 predictions_dt 有 7846 行,因为它有 wk_testing, 但是 predictions_dt 只有 165 行????

我不知道我做错了什么......

谁能帮帮我?

提前致谢

【问题讨论】:

  • 您的代码中在哪里定义了training2 变量?您是否可能在代码中打错字并使用了错误的变量?
  • 我从这样的训练中创建 training2: nzv

标签: prediction r-caret rpart


【解决方案1】:

如果您有缺失值,predict 函数默认为na.action = na.omit。您可以使用na.action = na.fail 进行测试以查看这是否是问题所在。如果是这种情况,您可能需要估算。请参阅train 中的preProcess 选项。

【讨论】:

    猜你喜欢
    • 2017-01-30
    • 2013-12-21
    • 2020-08-17
    • 2020-04-26
    • 2016-07-12
    • 2017-04-11
    • 1970-01-01
    • 2020-08-11
    • 2018-06-29
    相关资源
    最近更新 更多