决策树分类

1,概念

    统计学习方法五 决策树分类

    统计学习方法五 决策树分类

2,决策树算法

2.1,特征选择:

  熵:值越大,不确定性因素越大;条件熵:条件对结果的影响不确定性;信息增益;信息增益比

    统计学习方法五 决策树分类

            统计学习方法五 决策树分类

       统计学习方法五 决策树分类

 

2.2,决策树生成算法

  1,ID3算法

  统计学习方法五 决策树分类

  统计学习方法五 决策树分类

  2,c4.5算法

  统计学习方法五 决策树分类

3,实例说明

  统计学习方法五 决策树分类

            统计学习方法五 决策树分类

                                统计学习方法五 决策树分类

                             统计学习方法五 决策树分类

                           统计学习方法五 决策树分类

4,CART决策树算法

                 统计学习方法五 决策树分类

4.1 决策树生成

  回归树生成

             统计学习方法五 决策树分类

  分类树生成

          统计学习方法五 决策树分类

             统计学习方法五 决策树分类

                统计学习方法五 决策树分类

                     统计学习方法五 决策树分类

                          统计学习方法五 决策树分类

   举个例子:

     统计学习方法五 决策树分类

     第一种划分方法:{“学生”}、{“老师”、“上班族”} 来预测婚姻

        统计学习方法五 决策树分类

    第二种划分方法:{“老师”}、{“学生”、“上班族”}

                           统计学习方法五 决策树分类

    第三种划分方法:{“上班族”}、{“学生”、“老师”}

                        统计学习方法五 决策树分类

4.2,决策树剪枝

          统计学习方法五 决策树分类

 

    例如:图1中ti表示决策树中第i个节点,A、B表示训练集中的两个类别,A、B之后的数据表示落入该节点分别属于A类、B类的样本个数。 

         统计学习方法五 决策树分类

   统计学习方法五 决策树分类

5,决策树算法比较

    统计学习方法五 决策树分类

6,总结

  个人认为算法通过使用训练集构建一个决策树后,获得一系列的规则,输入测试集后,按照规则获取到叶节点,然后根据叶节点最大占有比的那个类为该测试集所属的类,从而达到分类效果

 

参考网址:

  1,cart例子

  2,剪枝例子

  3,决策树比较

 

相关文章:

  • 2021-07-09
  • 2021-04-07
  • 2021-05-10
  • 2021-08-31
  • 2021-11-21
  • 2021-07-23
  • 2022-12-23
  • 2021-05-31
猜你喜欢
  • 2022-02-09
  • 2021-07-03
  • 2021-07-14
  • 2021-07-15
  • 2021-04-23
  • 2021-07-27
相关资源
相似解决方案