【发布时间】:2013-04-15 17:34:03
【问题描述】:
我有一个结果变量,比如 Y 和一个可能影响 Y 的 100 个维度的列表(比如 X1...X100)。
在运行我的glm 并查看我的模型摘要后,我看到了那些具有统计意义的变量。我希望能够选择这些变量并运行另一个模型并比较性能。有没有一种方法可以解析模型摘要并仅选择重要的那些?
【问题讨论】:
-
试试glmulti 包。
-
此外,必须警告您不要以这种方式选择“重要”变量。统计显着性可以通过添加/删除单个自变量来改变。您的问题建议删除第一次运行时无关紧要的 all 变量。在这样做时,一些最初重要的变量将变得微不足道,而您删除的一些变量可能具有良好的预测价值。您真正想要的是逐个删除,逐步比较模型拟合。看到这个线程:bit.ly/ZLVaD5
-
@Maxim.K 逐步回归在 CrossValidated 上不受欢迎。正如我在聊天中所说,我可能会用套索来解决这个问题。无论如何,这里是题外话。