R中的决策树答案

【问题标题】：Decision tree in RR中的决策树
【发布时间】：2014-08-21 18:30:54
【问题描述】：

我是 R 机器学习的新手。这是我的数据集：

channels <- sample(c("AFFILIATE","DIRECT","DISPLAY"),100,T)
booking <- sample(c("N","Y"),100,T)
placements <- sample(c("R","L","TR","TL"),100,T)
site <- sample(c("www.google.com","www.yahoo.com"),100,T)
campaigns <- sample(c("camp1","camp2","camp3"),100,T)
data <- data.frame(channels,campaigns,site,placements,booking)

我想弄清楚哪个组合的预订概率更高。我使用以下 R 代码来计算决策树：

tree <- rpart(booking~channels+campaigns+site+placements,data=data,method="class")

它生成一个输出，但顺序不正确（我想要一棵树，其中的顺序应该是渠道 → 广告系列 → 网站 → 展示位置 → 预订）。此外，它只为每个父节点提供两个叶节点，但我想生成一棵树，其中每个父节点将有两个以上的叶节点。有没有可以满足要求的先进方法？提前致谢！！

【问题讨论】：

标签： r machine-learning decision-tree

【解决方案1】：

标准决策树不会对特征的顺序施加任何限制，除非它们的区分能力如何。所以我的猜测是你不会找到任何现成的实现来执行你描述的命令（也许其他人有其他建议？）。如果你想要严格的顺序，那么你可以自己编码。查看文献如何计算分裂的基尼/增益标准。

我知道的大多数实现都实现了二进制拆分，这意味着每个父级都有两个子级。您想要的称为“多路”拆分。

我希望这会有所帮助。

【讨论】：