1.决策树（decision tree）算法（ID3）

0.机器学习中分类和预测算法的评估：

1.1.判定书是一个类似于流程图的树结构：其中，每个内部结点表示在一个属性上的测试，每个分支代表一个属性输出，而每个树叶结点代表类或类分布。树的最顶层是根结点。

1.决策树（decision tree）算法（ID3）如图，首先根据天气这个属性可以分为三类，sunny在根据humidity这个属性进行分类，到最后的标记都属于通一个类别。

1.2机器学习中分类方法中的一个重要算法

1.3构造决策树的基本算法

1.决策树（decision tree）算法（ID3）

根据左边的表格，建立了右边的决策树，那是如何建立的呢？，为什么根节点是age这个属性？

1.决策树（decision tree）算法（ID3）

公式： 1.决策树（decision tree）算法（ID3） ——>变量的不确定性越多，熵也就越大。

第二步，选择属性判断结点

1.决策树（decision tree）算法（ID3）

注：Info即没有属性A分类时的熵，Infor_A即有属性A 分类时的熵。

根据公式计算上述的例子中的属性的熵，判断哪个为根节点。

1.决策树（decision tree）算法（ID3）

重复上述的操作。

1.所有的属性都是分类的，即离散值。连续性必须离散化。

2.上述递归划分停止的条件

3.剪枝

作为决策树中一种放置Overfitting过拟合的手段，分为预剪枝和后剪枝两种。

还有一些其他的算法：

1.决策树（decision tree）算法（ID3）

其他算法即选择哪个为属性根结点的度量方式不同。

1.决策树（decision tree）算法（ID3）

自己可以考虑怎么用python代码实现上述例子。