线性回归:过拟合或欠拟合

过拟合:一个假设在训练数据上能够获得比其他假设更好的拟合, 但是在训练数据外的数据集上却不能很好地拟合数据,此时认为这个假设出现了过拟合的现象。(模型过于复杂)

欠拟合:一个假设在训练数据上不能获得更好的拟合, 但是在训练数据外的数据集上也不能很好地拟合数据,此时认为这个假设出现了欠拟合的现象。(模型过于简单)

 

欠拟合:

原因:
学习到数据的特征过少
解决办法:
增加数据的特征数量

 

过拟合:

原因:
原始特征过多,存在一些嘈杂特征, 

模型过于复杂是因为模型尝试去兼顾

各个测试数据点

解决办法:
进行特征选择,消除关联性大的特征(很难做)
交叉验证(让所有数据都有过训练)
正则化(了解)


 

 

机器学习-------算法(十一)

 

机器学习-------算法(十一)

 

岭回归:一个加上了正则化的线性回归

主要讲解过拟合的解决方法正则化:

API:

sklearn.linear_model.Ridge

解释:

sklearn.linear_model.Ridge(alpha=1.0)
具有l2正则化的线性最小二乘法
alpha:正则化力度 0-1,1-10
coef_:回归系数

 

相关文章:

  • 2021-07-07
  • 2021-11-03
  • 2021-12-14
  • 2021-11-26
  • 2021-05-18
  • 2021-05-30
  • 2021-11-18
猜你喜欢
  • 2021-11-09
  • 2021-12-14
  • 2021-10-25
相关资源
相似解决方案