1.决策树的收敛
收敛从叶结点开始,向上收敛,少数服从多数。
8.22 数据挖掘(6)

2.熵的偏差
最下面是一个惩罚公式,分子是information gain,而分母是分裂的特征个数,作为一种有效的惩罚措施。
比如,单纯的按生日辨别男女,information gain很大,entrpy为0,但是这给系统一个错误的细化特征的倾向,实际上,每个人一条规则肯定是不合适的。
8.22 数据挖掘(6)

3.在决策树模型中,校验集的用途是用于控制对模型的剪枝操作。

4.分类,设置门槛(决策树模型中应如何妥善处理连续型属性)
A和B哪个更适合门槛?计算一下就知道
8.22 数据挖掘(6)

5.决策树的其他学习材料
8.22 数据挖掘(6)

相关文章:

  • 2021-12-02
  • 2021-07-02
猜你喜欢
  • 2022-01-17
  • 2021-11-29
  • 2021-06-02
  • 2021-12-06
  • 2021-12-03
  • 2021-11-02
  • 2022-12-23
相关资源
相似解决方案