【问题标题】:finding variable relation in R在R中找到变量关系
【发布时间】:2014-05-17 11:11:29
【问题描述】:

我有一个数据集,其列为

x1 x2 x3 x4 x5 y

它们都有整数/浮点值,Y 值范围从 98,000 到 1,10,000

如果我想找到 x1 和 y 、 x2 和 y ... x5 和 y 之间的关系并想出

y = A.x1+c

我该怎么做?

我尝试绘制图形,还尝试了 R 中的 lm() 和 fit() 函数。

fit <- lm(Y~X1+X2+X3+X4+X5,data=data)
step <- stepAIC(fit, direction="both")

请帮忙。

【问题讨论】:

    标签: r regression linear-regression regression-testing


    【解决方案1】:

    我认为它应该使用一些特殊的包来找到y 和变量xi 之间的最佳线性/关系。例如,您可以看到 leaps 包。

    您还可以通过遍历所有 xi 来找到关系。这是一种方法。最重要的是,我将您的代码扭曲到一个函数中。我使用dot formula 表示法。

    lm_col <-
      function(var,data){
        fit <- lm(y~.,subset(data,select=c('y',var)))
        stepAIC(fit, direction="both")
      }
    

    然后你使用lapply遍历所有变量:

     lapply(paste0('x',seq(5)),lm_col,data=dat)
    

    您可以使用此数据进行测试:

    dat <- as.data.frame(matrix(rnorm(6*10),ncol=6))
    colnames(dat) <- c(paste0('x',seq(5)),'y')
    

    但正如我一开始所说,从统计学上讲,我认为这不是做你想做的事情(不是很清楚)的最佳方式。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-05-28
      • 1970-01-01
      • 2021-06-25
      相关资源
      最近更新 更多