解释变量多于 LR 中的观察值，SPSS 如何排除变量答案

【问题标题】：With more explanatory variables than observations in LR, how does SPSS exclude variables解释变量多于 LR 中的观察值，SPSS 如何排除变量
【发布时间】：2017-01-24 13:13:03
【问题描述】：

我正在使用 SPSS 进行多次线性回归，并且每次都应用不同的过滤器来比较不同的组。对于许多过滤器，我只用 13 个观察值拟合回归，但有 15 或 24 个解释变量。在这些情况下，SPSS 会给我一个包含 12 个 beta 的模型，并且会排除剩余的变量（我认为这主要是我理解的）。

谁能告诉我 SPSS 如何选择要排除的变量以及告诉我这些变量对依赖项的影响（即 beta 是什么）？我最初认为我应该将这些变量视为具有零 beta，但现在不确定了。

提前感谢您的帮助！

拜托，没有 cmets 只告诉我在 13 个观察值上拟合回归是愚蠢的。如果您有一些有用的见解需要您首先指出具有 13 个观察值的回归不太理想，我很高兴听到您的意见。

【问题讨论】：

标签： regression linear-regression spss

【解决方案1】：

当模型完全可以拟合时，您不太可能在如此多的变量和如此少的观察中获得有用的结果。查看系数标准误。使用偏最小二乘 (PLS) 等技术可能会更好，它可以容纳比案例更多的变量。统计学中的 PLS 可通过扩展命令（分析 > 回归 > 偏最小二乘法）获得，但是，除了通常随 Statistics 一起安装的 Python Essentials 之外，它还需要安装一些额外的库。如果您想这样做，请参阅安装说明。

至于使用回归时哪些变量会被忽略，选择完全是任意的，因为除非存在完美的共线性，否则如果有 N 个案例，任何 N 个变量（包括常数项）都会给出完美的拟合。

【讨论】：

谢谢JKP。我完全同意，但不幸的是，我不得不将我的工作与我公司 7 年多来的工作保持一致。我也感谢您对 PLS 的建议，我一定会尽我所能进行调查。最后，感谢您的最后一段，这正是我想要的。这种完美契合的原因是不是非常难以理解，或者您是否知道任何可以在几页中解释它的来源？
嗯，它遵循基本的线性代数和回归的正规方程，但也许经验证明对您的听众更有说服力。生成 3 个随机变量，但只有两种情况。然后在其他任何一个上回归。您将看到仅使用一个变量和一个常数项的完美拟合，即使这些变量彼此无关。一旦残差为零，就没有其他解释变量可以改善拟合。