第二十七章:偏最小二乘线性回归分析

一.关于偏最小二乘法

1.定义

偏最小二乘回归法是一种新型的多元统计数据分析方法,它主要研究的是多因变量对多自变量的回归建模,特别当各变量内部高度线性相关时,用偏最小二乘回归法更有效。另外,偏最小二乘回归较好地解决了样本个数少于变量个数等问题。

2.数学原理

为了实现偏最小二乘回归的基本思想,要求t1和u1的协方差最大,即求解下面的优化问题
数学建模算法与应用学习(四)
利用拉格朗日乘数法求出w1和c1满足
数学建模算法与应用学习(四)
数学建模算法与应用学习(四)
数学建模算法与应用学习(四)

偏最小二乘回归的成分、残差矩阵有许多优良的性质 ,其中之一是成分之间是相互正交的,这在一定程度上消除了多重线性相关性。偏最小二乘回归算法的实质是按照协方差极大化准则,在分解自变量变量数据矩阵 X 的同时,也在分解因变量数据矩阵 Y,并且建立相互对应的解释隐变量与反应隐变量之间的回归关系方程,充分体现了偏最小二乘回归的基本思想。

二.Matlab 实现

1.建模过程

1.数据标准化
2.求相关系数矩阵
3.分别提出自变量组与因变量组的成分,在这里我的标准是当前k个成分解释自变量的比率达到90%时,取前k个成分
4.求k个成分对时标准化指标变量与成分变量之间的回归方程
5.求因变量与自变量组之间的回归方程,即将3中的成分带到4中所得的回归方程,得到标准化指标变量之间的回归方程,再将标准化的回归变量还原成原始变量。

2.Matlab 偏最小二乘回归命令plsregress

相关文章: