机器学习的一般泛型:
- 监督学习:
- 无监督学习:
- 强化学习:
决策树
- 熵:
-P*log§的总和
- 决策树每次分割的理由是让熵最小
- 树归纳停止准则
欠拟合和过拟合
- 欠拟合:特征值丢失
- 过拟合:过度拟合训练样本,讲训练样本中的噪声当作训练数据拟合。
决策树假设空间大小
可以看到假设空间非常大
克服过拟合的方法
- 预剪枝:
- 后剪枝:
建立决策树时数据缺失值的处理
可以看到数据缺失,如果直接抛弃这个数据就会浪费掉这个数据其它没有缺失的行的数据
我们做法是为这个缺失的数据分配权值。
多项式拟合正弦曲线的公式推导!!!
这样就可以用梯度下降法来求解了。