【发布时间】:2016-02-17 19:47:49
【问题描述】:
有没有办法让 R 运行所有可能的模型(包含数据集中的所有变量组合)以生成最佳/最准确的线性模型,然后输出该模型?
我觉得有办法做到这一点,但我很难找到信息。
【问题讨论】:
-
您如何定义最佳/最准确的线性模型?
-
library(leaps) allmods = regsubsets(y~x1+x2+x3+x4, nbest=2, data=mydata) summary(allmods) 我认为是这样的,但我想无需输入 x1+x2+...
-
请给我们
dput(mydata) -
运行所有可能的模型并不是一种非常科学的方法。您应该通过仅包含您认为会对响应变量产生影响的解释变量来构建模型。仅仅因为您拥有大量数据,并不意味着您应该包含所有数据。运行一些模型
lm1 = lm(y ~x1)和lm2 = lm(y~x2)等等,然后使用AIC(lm1,lm2)比较你的模型 -
运行所有可能的模型是探索性数据分析的一种形式。它还可以通过提取每个回归中所有变量的显着性值来用作验证性数据分析,以确保变量在罕见/有限情况下不显着。
标签: r model linear-regression lm