【问题标题】:Decision tree in RR中的决策树
【发布时间】:2014-08-21 18:30:54
【问题描述】:

我是 R 机器学习的新手。这是我的数据集:

channels <- sample(c("AFFILIATE","DIRECT","DISPLAY"),100,T)
booking <- sample(c("N","Y"),100,T)
placements <- sample(c("R","L","TR","TL"),100,T)
site <- sample(c("www.google.com","www.yahoo.com"),100,T)
campaigns <- sample(c("camp1","camp2","camp3"),100,T)
data <- data.frame(channels,campaigns,site,placements,booking)

我想弄清楚哪个组合的预订概率更高。我使用以下 R 代码来计算决策树:

tree <- rpart(booking~channels+campaigns+site+placements,data=data,method="class")

它生成一个输出,但顺序不正确(我想要一棵树,其中的顺序应该是渠道 → 广告系列 → 网站 → 展示位置 → 预订)。此外,它只为每个父节点提供两个叶节点,但我想生成一棵树,其中每个父节点将有两个以上的叶节点。有没有可以满足要求的先进方法? 提前致谢!!

【问题讨论】:

    标签: r machine-learning decision-tree


    【解决方案1】:

    标准决策树不会对特征的顺序施加任何限制,除非它们的区分能力如何。所以我的猜测是你不会找到任何现成的实现来执行你描述的命令(也许其他人有其他建议?)。如果你想要严格的顺序,那么你可以自己编码。查看文献如何计算分裂的基尼/增益标准。

    我知道的大多数实现都实现了二进制拆分,这意味着每个父级都有两个子级。您想要的称为“多路”拆分。

    我希望这会有所帮助。

    【讨论】:

      猜你喜欢
      • 2016-05-18
      • 2014-08-20
      • 2018-07-24
      • 1970-01-01
      • 2014-05-09
      • 1970-01-01
      • 2018-06-11
      • 2014-12-11
      • 2021-12-16
      相关资源
      最近更新 更多