【问题标题】:R: how to use the subset option in rpart?R:如何使用 rpart 中的子集选项?
【发布时间】:2020-08-18 12:43:39
【问题描述】:

help(rpart) 的文档中,有一个subset 选项,它是一个“可选表达式,表示应仅使用数据行的子集。”

我该如何使用这个选项?

library(rpart)
fit <- rpart(Kyphosis ~ Age + Number + Start,
             data = kyphosis,
             subset = sample(1:nrow(kyphosis), 20))

在上面的代码中,我从kyphosis 数据中随机抽取了20 个行索引。这是正确的用法吗?

【问题讨论】:

  • 你可以随时查看idx = sample(1:nrow(kyphosis), 20); fit &lt;- rpart(Kyphosis ~ Age + Number + Start,data = kyphosis,subset=idx) ; levels(kyphosis$Kyphosis)[fit$y]==kyphosis$Kyphosis[idx]

标签: r decision-tree rpart


【解决方案1】:

是的,没关系。使用subset,您还可以:

  • 明确选择data.frame 的行:subset=1:21
  • 根据变量值选择行:subset=(Age&lt;50)

【讨论】:

    猜你喜欢
    • 2014-06-16
    • 2021-11-20
    • 2016-03-07
    • 2015-08-29
    • 2021-01-08
    • 2018-09-25
    • 2016-10-08
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多