【发布时间】:2020-08-18 12:43:39
【问题描述】:
在help(rpart) 的文档中,有一个subset 选项,它是一个“可选表达式,表示应仅使用数据行的子集。”
我该如何使用这个选项?
library(rpart)
fit <- rpart(Kyphosis ~ Age + Number + Start,
data = kyphosis,
subset = sample(1:nrow(kyphosis), 20))
在上面的代码中,我从kyphosis 数据中随机抽取了20 个行索引。这是正确的用法吗?
【问题讨论】:
-
你可以随时查看
idx = sample(1:nrow(kyphosis), 20); fit <- rpart(Kyphosis ~ Age + Number + Start,data = kyphosis,subset=idx) ; levels(kyphosis$Kyphosis)[fit$y]==kyphosis$Kyphosis[idx]
标签: r decision-tree rpart