【问题标题】:With more explanatory variables than observations in LR, how does SPSS exclude variables解释变量多于 LR 中的观察值,SPSS 如何排除变量
【发布时间】:2017-01-24 13:13:03
【问题描述】:

我正在使用 SPSS 进行多次线性回归,并且每次都应用不同的过滤器来比较不同的组。对于许多过滤器,我只用 13 个观察值拟合回归,但有 15 或 24 个解释变量。在这些情况下,SPSS 会给我一个包含 12 个 beta 的模型,并且会排除剩余的变量(我认为这主要是我理解的)。

谁能告诉我 SPSS 如何选择要排除的变量以及告诉我这些变量对依赖项的影响(即 beta 是什么)?我最初认为我应该将这些变量视为具有零 beta,但现在不确定了。

提前感谢您的帮助!

拜托,没有 cmets 只告诉我在 13 个观察值上拟合回归是愚蠢的。如果您有一些有用的见解需要您首先指出具有 13 个观察值的回归不太理想,我很高兴听到您的意见。

【问题讨论】:

    标签: regression linear-regression spss


    【解决方案1】:

    当模型完全可以拟合时,您不太可能在如此多的变量和如此少的观察中获得有用的结果。查看系数标准误。使用偏最小二乘 (PLS) 等技术可能会更好,它可以容纳比案例更多的变量。统计学中的 PLS 可通过扩展命令(分析 > 回归 > 偏最小二乘法)获得,但是,除了通常随 Statistics 一起安装的 Python Essentials 之外,它还需要安装一些额外的库。如果您想这样做,请参阅安装说明。

    至于使用回归时哪些变量会被忽略,选择完全是任意的,因为除非存在完美的共线性,否则如果有 N 个案例,任何 N 个变量(包括常数项)都会给出完美的拟合。

    【讨论】:

    • 谢谢JKP。我完全同意,但不幸的是,我不得不将我的工作与我公司 7 年多来的工作保持一致。我也感谢您对 PLS 的建议,我一定会尽我所能进行调查。最后,感谢您的最后一段,这正是我想要的。这种完美契合的原因是不是非常难以理解,或者您是否知道任何可以在几页中解释它的来源?
    • 嗯,它遵循基本的线性代数和回归的正规方程,但也许经验证明对您的听众更有说服力。生成 3 个随机变量,但只有两种情况。然后在其他任何一个上回归。您将看到仅使用一个变量和一个常数项的完美拟合,即使这些变量彼此无关。一旦残差为零,就没有其他解释变量可以改善拟合。
    猜你喜欢
    • 2013-12-03
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-04-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多