1. 回顾线性回归 

    首先我们简要回归下线性回归的一般形式: 

    坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 

    需要极小化的损失函数是: 

    坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 

    如果用梯度下降法求解,则每一轮坐标轴下降法与最小角回归法 

迭代的表达式是: 

    坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 

    其中坐标轴下降法与最小角回归法 

为步长。

    如果用最小二乘法,则坐标轴下降法与最小角回归法 

的结果是:

    坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 

2. 回顾Ridge回归

    由于直接套用线性回归可能产生过拟合,我们需要加入正则化项,如果加入的是L2正则化项,就是Ridge回归,有时也翻译为脊回归。它和一般线性回归的区别是在损失函数上增加了一个L2正则化的项,和一个调节线性回归项和正则化项权重的系数坐标轴下降法与最小角回归法 

。损失函数表达式如下:

    坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  

    其中坐标轴下降法与最小角回归法 

为常数系数,需要进行调优。坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  

为L2范数。

    Ridge回归的解法和一般线性回归大同小异。如果采用梯度下降法,则每一轮坐标轴下降法与最小角回归法 

迭代的表达式是:

    坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 

    其中坐标轴下降法与最小角回归法 

为步长。

    如果用最小二乘法,则坐标轴下降法与最小角回归法 

的结果是:

    坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 

 

    其中E为单位矩阵。

    Ridge回归在不抛弃任何一个变量的情况下,缩小了回归系数,使得模型相对而言比较的稳定,但这会使得模型的变量特别多,模型解释性差。有没有折中一点的办法呢?即又可以防止过拟合,同时克服Ridge回归

模型变量多的缺点呢?有,这就是下面说的Lasso回归。

3. 初识Lasso回归 

    Lasso回归有时也叫做线性回归的L1正则化,和Ridge回归的主要区别就是在正则化项,Ridge回归用的是L2正则化,而Lasso回归用的是L1正则化。Lasso回归的损失函数表达式如下: 

    坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  

    其中n为样本个数,坐标轴下降法与最小角回归法 

为常数系数,需要进行调优。坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  

为L1范数。   

    Lasso回归使得一些系数变小,甚至还是一些绝对值较小的系数直接变为0,因此特别适用于参数数目缩减与参数的选择,因而用来估计稀疏参数的线性模型。
 
    但是Lasso回归有一个很大的问题,导致我们需要把它单独拎出来讲,就是它的损失函数不是连续可导的,由于L1范数用的是绝对值之和,导致损失函数有不可导的点。也就是说,我们的最小二乘法,梯度下降法,牛顿法与拟牛顿法对它统统失效了。那我们怎么才能求有这个L1范数的损失函数极小值呢?
 
    OK,本章主角,两种全新的求极值解法坐标轴下降法(coordinate descent)和最小角回归法( Least Angle Regression, LARS)该隆重出场了。          

4. 用坐标轴下降法求解Lasso回归

    坐标轴下降法顾名思义,是沿着坐标轴的方向去下降,这和梯度下降不同。梯度下降是沿着梯度的负方向下降。不过梯度下降和坐标轴下降的共性就都是迭代法,通过启发式的方式一步步迭代求解函数的最小值。

    坐标轴下降法的数学依据主要是这个结论(此处不做证明):一个可微的凸函数坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 

, 其中坐标轴下降法与最小角回归法 是nx1的向量,即有n个维度。如果在某一点坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法   ,使得坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 在每一个坐标轴坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法   坐标轴下降法与最小角回归法  (i = 1,2,...n)上都是最小值,那么坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法   坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 

就是一个全局的最小值。

    于是我们的优化目标就是在坐标轴下降法与最小角回归法 

的n个坐标轴上(或者说向量的方向上)对损失函数做迭代的下降,当所有的坐标轴上的坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  (i = 1,2,...n)都达到收敛时,我们的损失函数最小,此时的坐标轴下降法与最小角回归法 

即为我们要求的结果。

    下面我们看看具体的算法过程:

    1. 首先,我们把坐标轴下降法与最小角回归法 

向量随机取一个初值。记为坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  

,上面的括号里面的数字代表我们迭代的轮数,当前初始轮数为0.

    2. 对于第k轮的迭代。我们从坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  

开始,到坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  为止,依次求坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  

的表达式如下:

    坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法   坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 

 

    也就是说坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  

是使坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 最小化时候的坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  的值。此时坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 只有坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  

是变量,其余均为常量,因此最小值容易通过求导求得。

    如果上面这个式子不好理解,我们具体一点,在第k轮,坐标轴下降法与最小角回归法 

向量的n个维度的迭代式如下:

    坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法   坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 

 

    坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法   坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 

 

    ...

    坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法   坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 

 

    3. 检查坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  

向量和坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  向量在各个维度上的变化情况,如果在所有维度上变化都足够小,那么坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  

即为最终结果,否则转入2,继续第k+1轮的迭代。

    以上就是坐标轴下降法的求极值过程,可以和梯度下降做一个比较:

    a) 坐标轴下降法在每次迭代中在当前点处沿一个坐标方向进行一维搜索 ,固定其他的坐标方向,找到一个函数的局部极小值。而梯度下降总是沿着梯度的负方向求函数的局部最小值。
    b) 坐标轴下降优化方法是一种非梯度优化算法。在整个过程中依次循环使用不同的坐标方向进行迭代,一个周期的一维搜索迭代过程相当于一个梯度下降的迭代。
    c) 梯度下降是利用目标函数的导数来确定搜索方向的,该梯度方向可能不与任何坐标轴平行。而坐标轴下降法法是利用当前坐标方向进行搜索,不需要求目标函数的导数,只按照某一坐标方向进行搜索最小值。
    d) 两者都是迭代方法,且每一轮迭代,都需要O(mn)的计算量(m为样本数,n为系数向量的维度)

5. 用最小角回归法求解Lasso回归

    第四节介绍了坐标轴下降法求解Lasso回归的方法,此处再介绍另一种常用方法, 最小角回归法(Least Angle Regression, LARS)。

    在介绍最小角回归前,我们先看看两个预备算法,好吧,这个算法真没有那么好讲。

5.1 前向选择(Forward Selection)算法

    第一个预备算法是前向选择(Forward Selection)算法。

    前向选择算法的原理是是一种典型的贪心算法。要解决的问题是对于:

    坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 

这样的线性关系,如何求解系数向量坐标轴下降法与最小角回归法 的问题。其中坐标轴下降法与最小角回归法 为 mx1的向量,坐标轴下降法与最小角回归法 为mxn的矩阵,坐标轴下降法与最小角回归法 

为nx1的向量。m为样本数量,n为特征维度。

    把 矩阵坐标轴下降法与最小角回归法 

看做n个mx1的向量坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  (i=1,2,...n),在坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 变量坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  (i =1,2,...m)中,选择和目标坐标轴下降法与最小角回归法 最为接近(余弦距离最大)的一个变量坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  ,用坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  来逼近坐标轴下降法与最小角回归法 

,得到下式:

    坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  

    其中: 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法    
    即:坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法   
 是 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  上的投影。那么,可以定义残差(residual):   坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法   。由于是投影,所以很容易知道 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  是正交的。再以坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  为新的因变量,去掉坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  后,剩下的自变量的集合坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  
,i=1,2,3...k−1,k+1,...n}为新的自变量集合,重复刚才投影和残差的操作,直到残差为0,或者所有的自变量都用完了,才停止算法。
坐标轴下降法与最小角回归法
    当坐标轴下降法与最小角回归法 只有2维时,例子如上图,和坐标轴下降法与最小角回归法 最接近的是坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  ,首先在坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  上面投影,残差如上图长虚线。此时坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  模拟了坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  模拟了坐标轴下降法与最小角回归法 (仅仅模拟了一个维度)。接着发现最接近的是坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  ,此时用残差接着在坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  投影,残差如图中短虚线。由于没有其他自变量了,此时坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  模拟了坐标轴下降法与最小角回归法 ,对应的模拟了两个维度的坐标轴下降法与最小角回归法 即为最终结果,此处坐标轴下降法与最小角回归法 计算设计较多矩阵运算,这里不讨论。
    此算法对每个变量只需要执行一次操作,效率高,速度快。但也容易看出,当自变量不是正交的时候,由于每次都是在做投影,所有算法只能给出一个局部近似解。因此,这个简单的算法太粗糙,还不能直接用于我们的Lasso回归。
 

5.2 前向梯度(Forward Stagewise)算法

    第二个预备算法是前向梯度(Forward Stagewise)算法。

    前向梯度算法和前向选择算法有类似的地方,也是在坐标轴下降法与最小角回归法 

坐标轴下降法与最小角回归法 变量坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  (i =1,2,...n)中,选择和目标坐标轴下降法与最小角回归法 最为接近(余弦距离最大)的一个变量坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  ,用坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  来逼近坐标轴下降法与最小角回归法 ,但是前向梯度算法不是粗暴的用投影,而是每次在最为接近的自变量坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  的方向移动一小步,然后再看残差坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  和哪个坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  (i =1,2,...n)最为接近。此时我们也不会把坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法   去除,因为我们只是前进了一小步,有可能下面最接近的自变量还是坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  。如此进行下去,直到残差坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  

减小到足够小,算法停止。

    坐标轴下降法与最小角回归法
    当坐标轴下降法与最小角回归法 
只有2维时,例子如上图,和坐标轴下降法与最小角回归法 最接近的是坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  ,首先在坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  上面走一小段距离,此处坐标轴下降法与最小角回归法 为一个较小的常量,发现此时的残差还是和\坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  最接近。那么接着沿坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  走,一直走到发现残差不是和坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  最接近,而是和坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  最接近,此时残差如上图长虚线。接着沿着坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  走一小步,发现残差此时又和坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  最接近,那么开始沿着坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  走,走完一步后发现残差为0,那么算法停止。此时坐标轴下降法与最小角回归法 由刚才所有的所有步相加而模拟,对应的算出的系数坐标轴下降法与最小角回归法 即为最终结果。此处坐标轴下降法与最小角回归法 
计算设计较多矩阵运算,这里不讨论。
    当算法在坐标轴下降法与最小角回归法 
很小的时候,可以很精确的给出最优解,当然,其计算的迭代次数也是大大的增加。和前向选择算法相比,前向梯度算法更加精确,但是更加复杂。

    有没有折中的办法可以综合前向梯度算法和前向选择算法的优点,做一个折中呢?有!这就是终于要出场的最小角回归法。

5.3  最小角回归(Least Angle Regression, LARS)算法

    好吧,最小角回归(Least Angle Regression, LARS)算法终于出场了。最小角回归法对前向梯度算法和前向选择算法做了折中,保留了前向梯度算法一定程度的精确性,同时简化了前向梯度算法一步步迭代的过程。具体算法是这样的: 

    首先,还是找到与因变量坐标轴下降法与最小角回归法 

最接近或者相关度最高的自变量坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  ,使用类似于前向梯度算法中的残差计算方法,得到新的目标坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  ,此时不用和前向梯度算法一样小步小步的走。而是直接向前走直到出现一个坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  ,使得坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  的相关度和坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  的相关度是一样的,此时残差坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  就在坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  的角平分线方向上,此时我们开始沿着这个残差角平分线走,直到出现第三个特征坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  的相关度足够大的时候,即坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  到当前残差坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  的相关度和坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  的一样。将其也叫入到坐标轴下降法与最小角回归法 的逼近特征集合中,并用坐标轴下降法与最小角回归法 的逼近特征集合的共同角分线,作为新的逼近方向。以此循环,直到坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法坐标轴下降法与最小角回归法  足够的小,或者说所有的变量都已经取完了,算法停止。此时对应的系数坐标轴下降法与最小角回归法 

即为最终结果。

 坐标轴下降法与最小角回归法

    当坐标轴下降法与最小角回归法 

只有2维时,例子如上图,和坐标轴下降法与最小角回归法 最接近的是坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  ,首先在坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  上面走一段距离,一直到残差在坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  坐标轴下降法与最小角回归法 坐标轴下降法与最小角回归法  的角平分线上,此时沿着角平分线走,直到残差最够小时停止,此时对应的系数坐标轴下降法与最小角回归法 即为最终结果。此处坐标轴下降法与最小角回归法 

计算设计较多矩阵运算,这里不讨论。

    最小角回归法是一个适用于高维数据的回归算法,其主要的优点有:

    1)特别适合于特征维度n 远高于样本数m的情况。

    2)算法的最坏计算复杂度和最小二乘法类似,但是其计算速度几乎和前向选择算法一样

    3)可以产生分段线性结果的完整路径,这在模型的交叉验证中极为有用

    主要的缺点是:

    由于LARS的迭代方向是根据目标的残差而定,所以该算法对样本的噪声极为敏感。

6. 总结

    Lasso回归是在ridge回归的基础上发展起来的,如果模型的特征非常多,需要压缩,那么Lasso回归是很好的选择。一般的情况下,普通的线性回归模型就够了。

    另外,本文对最小角回归法怎么求具体的坐标轴下降法与最小角回归法 

参数值没有提及,仅仅涉及了原理,如果对具体的算计推导有兴趣,可以参考Bradley Efron的论文《Least Angle Regression》,网上很容易找到。

相关文章: