多个样本的 R 回归

【问题标题】：R regression on multiple samples多个样本的 R 回归
【发布时间】：2020-07-29 10:19:26
【问题描述】：

我正在使用 R

我有一个面板数据集，包含 250 个人随时间推移的约 5000 次观察结果。

我需要在差异回归中建立差异，因此我为每个人绘制随机观察结果并运行回归：

lm(x ~ x1 + x2 + ... , data = ddply(df,.(individual),function(x) x[sample(nrow(x),1),]))

在结果样本上。

我需要计算 n 个不同随机样本的回归 n 次，并计算每个估计量的平均值。

有没有一种方法可以在不手动计算和平均 n 回归的情况下有效地做到这一点？

【问题讨论】：

标签： r regression plyr lm sampling

【解决方案1】：

已解决：

我希望找到一个特定的包来执行此操作，但我构建了一个函数。例如，对于 n = 700

fun <- function(alfa){
  alfa <-ddply(df,.(individual),function(x) x[sample(nrow(x),1),])
  beta <- lm(x ~ x1 + x2 + ... , data = alfa )$coefficients
  return(beta)
}

df.full <- replicate(700,fun(alfa))

这样创建了一个包含 700 行的数据集，系数名称为行。我什至可以做这样的事情：

fun <- function(alfa){
  alfa <-ddply(df,.(individual),function(x) x[sample(nrow(x),1),])
  beta <- lm(x ~ x1 + x2 + ... , data = alfa)
  gamma <- summary(beta)[["coefficients"]][,1]
  return(gamma)

}

df.full <- replicate(700,fun(alfa))

将 [,1] 更改为 [,2] 我将获得标准错误。在此之后，手段的计算直接进行。

【讨论】：