【发布时间】:2013-02-26 06:01:05
【问题描述】:
我正在使用 R 中的 rpart 包创建一些决策树。我的数据集中有年龄、儿童数量等离散变量。但是生成的决策树有这些变量 n 小数。这意味着,它被视为连续变量。
如何避免这种情况以及如何在决策树中将这些变量作为离散变量?
【问题讨论】:
标签: r classification decision-tree rpart
我正在使用 R 中的 rpart 包创建一些决策树。我的数据集中有年龄、儿童数量等离散变量。但是生成的决策树有这些变量 n 小数。这意味着,它被视为连续变量。
如何避免这种情况以及如何在决策树中将这些变量作为离散变量?
【问题讨论】:
标签: r classification decision-tree rpart
将它们变成因子,这是在 R 中表示离散变量的标准方法。
【讨论】:
text(tree, pretty=1) 应该在树的图上放置实际标签。
str 函数进行检查。