【发布时间】:2018-06-15 10:54:27
【问题描述】:
我有一个关于 R 中 rpart 分类树的输出的问题。如果存在缺失值,则使用代理拆分。这是一个例子。
Surrogate splits:
## bmi < 21.51 to the right, agree=0.858, adj=0.632, (0 split)
协议是否计算为代理拆分与主要拆分一致的案例比例?例如,如果代理未能就 4 个数据点中的 1 个达成一致,则协议将为 0.75。它是否正确?
此外,我不确定我对 adj 的解释。这是调整后的协议,考虑到偶然的协议吗?如果是这样,这是如何计算的?我认为这一定与数据中的先验有关,但不确定。
感谢任何见解。提前谢谢你。
【问题讨论】:
标签: r machine-learning decision-tree rpart