ridge regression可以用来处理下面两类问题:一是数据点少于变量个数;二是变量间存在共线性。

当变量间存在共线性的时候,最小二乘回归得到的系数不稳定,方差很大。这是因为系数矩阵X与它的转置矩阵相乘得到的矩阵不能求得其逆矩阵,而ridge regression通过引入参数lambda,使得该问题得到解决。在R语言中,MASS包中的函数lm.ridge()可以很方便的完成。它的输入矩阵X始终为n x p 维,不管是否包含常数项。下面分别介绍包含和不包含常数项时的输出:

当包含常数项时,该函数对y进行中心化,以y的均值作为因子;对x进行中心化和归一化,以x中各个变量的均值和标准差作为因子。这样对x和y处理后,x和y的均值为0,这使得回归平面经过原点,即常数项为0.因此,虽然指定了包含常数项,它给出的系数(lmridgehttp://blog.sciencenet.cn/blog-54276-375345.html 

相关文章:

  • 2022-12-23
  • 2021-10-18
  • 2021-11-29
  • 2021-12-20
  • 2021-07-20
  • 2022-12-23
  • 2021-11-22
  • 2021-12-02
猜你喜欢
  • 2022-01-06
  • 2022-01-11
  • 2021-12-25
  • 2021-07-12
  • 2022-12-23
  • 2022-12-23
相关资源
相似解决方案