【问题标题】:Multi-way clustered standard errors in R survey packageR调查包中的多路聚类标准误差
【发布时间】:2021-10-24 00:39:52
【问题描述】:

我想使用调查权重对 R 中多个级别的标准误差进行聚类。我认为 Lumley 的调查包没有这样做是对的吗?在下面的 reprex 中,具有一级和二级聚类的 svyglm 具有相同的标准误差。有什么想法吗?

library(survey) 

data(api)

dclus0<-svydesign(id=~1, weights=~pw, data=apiclus2) # no clustering
dclus1<-svydesign(id=~dnum, weights=~pw, data=apiclus2) # clustering at one level
dclus2<-svydesign(id=~dnum+snum, weights=~pw, data=apiclus2) # clustering at two levels

summary(svyglm(api00~ell+meals+mobility, design=dclus0)) # no clustering
summary(svyglm(api00~ell+meals+mobility, design=dclus1)) # clustering at one level
summary(svyglm(api00~ell+meals+mobility, design=dclus2)) # clustering at two levels

【问题讨论】:

  • 这可能很有用,来自svydesign 函数文档。 “每个抽样级别的总体规模也应在 fpc 中指定。如果未指定 fpc,则假定抽样在顶层进行替换,并且仅在计算方差时使用集群的第一阶段。”
  • 您选择的变量可能重叠过多? ~stype~both+stype 的标准错误不同
  • **更新:R (svyglm) 和 STATA(ivrobust2 和 cluster2 函数)产生非常相似的标准错误,*以典型方式嵌套的数据,例如,学生分数嵌套在教室中嵌套在学校中。然而,当事情稍微复杂一点时,他们不同意:例如,在我的数据中,每个调查对象都随机选择了 20 个新闻标题(从大约 100 个标题中)并回答了一个关于每个问题的问题。因此,我在受访者和新闻标题中嵌套了回复。
  • 除了 STATA 和 svyglm 不会产生相同的结果之外,另一个迹象表明发生了一些奇怪的事情:svyglm 指示错误的集群数量:“2-level Cluster Sampling design (with replacement)有 (59, 8647) 个簇。” 59 = 标题数量,但 8647 不是受访者数量。相反,它是受访者人数乘以 20(每位受访者评分的标题数量)
  • 这是我的调查设计对象的样子:svydesign(id=~hdl_id + id, weights = ~weight, data = long)

标签: r statistics survey


【解决方案1】:

我怀疑 8647 是受访者的数量乘以 20,但是,好吧,缺少数据或其他东西。

如果它是嵌套的,并且没有替换的采样,正如您告诉svydesign 的那样,对于这两个分析获得相同的标准误差是正确的。并且数字 (59, 8647) 也是正确的:第 1 阶段有 59 个采样单元,第 2 阶段有 8647 个采样单元。

您(我认为)有两个观察结果相关的数据,如果它们共享一个参与者或共享一个标题。此设计不是嵌套的,而是交叉的:标题 1 的参与者 1 与标题 2 的参与者 1 是同一个人。

实际上我很久以前就在 R 中为此编写了标准误差估计代码,以至于 CRAN 不存在:代码是 here,函数称为 xeffect.glm。我认为这与后来独立发明并放入 Stata 中的-cluster2- 的方法相同。该代码适用于glm 对象,但它允许权重,因此将采样权重作为权重放入glm 中以获得点估计,然后将生成的glm 对象提供给xeffect.glm

作为额外的历史记录:该链接的其余代码由 Achim Zeileis 在 sandwich 包中重新实现,但交叉效应估计器没有,因为他主要对时间序列感兴趣。

【讨论】:

  • 这对我来说非常有效(正在使用 STATA IVREG2 进行复制)。非常感谢!
  • 太棒了!你可以接受答案吗?
  • 哎呀,是的!完毕!再次感谢托马斯!
猜你喜欢
  • 2017-12-14
  • 2017-10-15
  • 2016-04-13
  • 2015-01-31
  • 1970-01-01
  • 2018-05-27
  • 1970-01-01
  • 2013-05-06
  • 1970-01-01
相关资源
最近更新 更多