【问题标题】:R regression on multiple samples多个样本的 R 回归
【发布时间】:2020-07-29 10:19:26
【问题描述】:

我正在使用 R

我有一个面板数据集,包含 250 个人随时间推移的约 5000 次观察结果。

我需要在差异回归中建立差异,因此我为每个人绘制随机观察结果并运行回归:

lm(x ~ x1 + x2 + ... , data = ddply(df,.(individual),function(x) x[sample(nrow(x),1),]))

在结果样本上。

我需要计算 n 个不同随机样本的回归 n 次,并计算每个估计量的平均值。

有没有一种方法可以在不手动计算和平均 n 回归的情况下有效地做到这一点?

【问题讨论】:

    标签: r regression plyr lm sampling


    【解决方案1】:

    已解决:

    我希望找到一个特定的包来执行此操作,但我构建了一个函数。例如,对于 n = 700

    fun <- function(alfa){
      alfa <-ddply(df,.(individual),function(x) x[sample(nrow(x),1),])
      beta <- lm(x ~ x1 + x2 + ... , data = alfa )$coefficients
      return(beta)
    }
    
    df.full <- replicate(700,fun(alfa))
    

    这样创建了一个包含 700 行的数据集,系数名称为行。我什至可以做这样的事情:

    fun <- function(alfa){
      alfa <-ddply(df,.(individual),function(x) x[sample(nrow(x),1),])
      beta <- lm(x ~ x1 + x2 + ... , data = alfa)
      gamma <- summary(beta)[["coefficients"]][,1]
      return(gamma)
    
    }
    
    df.full <- replicate(700,fun(alfa))
    

    将 [,1] 更改为 [,2] 我将获得标准错误。在此之后,手段的计算直接进行。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2017-01-04
      • 2021-11-15
      • 2019-07-02
      • 1970-01-01
      • 1970-01-01
      • 2015-06-26
      • 2017-10-20
      相关资源
      最近更新 更多