【发布时间】:2014-06-16 23:45:07
【问题描述】:
我无法使用 rpart 获得太多信息。
我有一个数据框:
a = structure(list(V1 = c(2, 3, 4, 2, 3, 2, 3, 3, 5, 3), V2 = c(15,
26, 94, 15, 26, 33, 33, 33, 5, 15), V3 = structure(c(1L, 1L,
1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L), .Label = c("f", "t"), class = "factor")), .Names = c("V1",
"V2", "V3"), row.names = c(NA, -10L), class = "data.frame")
> a
V1 V2 V3
1 2 15 f
2 3 26 f
3 4 94 f
4 2 15 f
5 3 26 f
6 2 33 f
7 3 33 f
8 3 33 t
9 5 5 t
10 3 15 t
> rpart(V3 ~ ., data=a)
n= 10
node), split, n, loss, yval, (yprob)
* denotes terminal node
1) root 10 3 f (0.7000000 0.3000000) *
为什么 rpart 没有提供更多信息,例如 (V1 == 2) 的三种情况都导致 response = "f"(第 1、4、6 行)?
本质上,我想知道:
- rpart 在给我上面的输出之前运行了哪些测试?
- rpart 是否包含测试 (V2 == 2) -> 响应统计信息,如果没有,我如何使其包含这样的测试和结果?
我已阅读rpart vignette,但没有找到答案。
【问题讨论】:
标签: r