【发布时间】:2014-08-21 18:30:54
【问题描述】:
我是 R 机器学习的新手。这是我的数据集:
channels <- sample(c("AFFILIATE","DIRECT","DISPLAY"),100,T)
booking <- sample(c("N","Y"),100,T)
placements <- sample(c("R","L","TR","TL"),100,T)
site <- sample(c("www.google.com","www.yahoo.com"),100,T)
campaigns <- sample(c("camp1","camp2","camp3"),100,T)
data <- data.frame(channels,campaigns,site,placements,booking)
我想弄清楚哪个组合的预订概率更高。我使用以下 R 代码来计算决策树:
tree <- rpart(booking~channels+campaigns+site+placements,data=data,method="class")
它生成一个输出,但顺序不正确(我想要一棵树,其中的顺序应该是渠道 → 广告系列 → 网站 → 展示位置 → 预订)。此外,它只为每个父节点提供两个叶节点,但我想生成一棵树,其中每个父节点将有两个以上的叶节点。有没有可以满足要求的先进方法? 提前致谢!!
【问题讨论】:
标签: r machine-learning decision-tree