可复制数据集在如下评论第一条!
第1步计算决策属性的熵 | ||
| S1 (买) = | 641 | |
| S2(不买)= | 383 | |
| S= S1+S2 = | 1024 | |
| P1=641/1024= | 0.625976563 | |
| P2=383/1024= | 0.374023438 | |
第二步计算各类属性的熵 | |||||||
| 分类属性共有4个。分别是年龄、收入、学生、信誉。 | |||||||
| 分别计算不同属性的信息增益 | |||||||
| 年龄信息增益=0.9537-0.6877=0.2660 | |||
| 收入信息增益=0.9537-0.9361=0.0176 | |||
| 学生信息增益=0.9537-0.7811=0.1726 | |||
| 信誉信息增益=0.9537-0.9048=0.0453 |