机器学习基础——过拟合,欠拟合
最左边属于欠拟合,最右边过拟合
欠拟合是对数据拟合的不好,在训练集和测试集上的表现都很差。
过拟合在训练集上表现得很好,在测试集上表现得不好
欠拟合原因:
模型过于简单————使用更复杂的模型,集成
训练次数不够————增加训练次数
过拟合原因:
模型过于复杂
训练数据
数据中噪声多
解决过拟合方法:
简化模型
减少模型参数:对于决策树可以剪枝
对于神经网络可以减少层数,每层的神经元数目;使用dropout
进行数据清洗,减少噪声
使用更多数据
上采样,GAN生成数据,对于图像数据可以对其旋转,平移,缩放,裁剪,改变分辨率,对比度,亮度等。增加随机噪声
提前停止训练
模型训练的时候,验证集误差达到最低就提前停止训练
多模型投票
投票法可以规避过拟合,即使有一两个过拟合的模型,但是综合起来可以降低过拟合,起到正则化的作用。
正则化
L1,L2,L0正则化(后续学习)
针对DNN可以Batch norm等等

相关文章: