【问题标题】:Pair-matched count regression in R with offset?R中带有偏移量的配对计数回归?
【发布时间】:2022-01-26 13:47:56
【问题描述】:
我需要在 R 中进行配对匹配计数回归。
具体来说,我的数据如下:
| ID |
Exposure |
Occurrence |
Area |
| 1 |
0 |
7 |
50 |
| 1 |
1 |
5 |
55 |
| 2 |
0 |
6 |
70 |
| 2 |
1 |
8 |
74 |
| 3 |
0 |
4 |
45 |
| 3 |
1 |
9 |
62 |
我需要基于每平方英尺(面积)的相对比率得出结果,因此我想使用偏移量。
虽然我认为这不会太难,但我在 Google 搜索中遇到了困难,因为配对匹配的数据如此频繁地得到二元结果。
你知道一个好的包或能够做到这一点的方法吗?
【问题讨论】:
标签:
r
regression
hypothesis-testing
count-data
offset
【解决方案1】:
您应该能够使用具有计数响应的混合模型(例如 Poisson 或负二项式)来执行此操作:您需要“标准”计数 GLM-with-offset 模型,其中跨 ID 的截距随机变化:
$$
\开始{拆分}
\eta_{ij} & = \beta_0 + b_i + \beta_1 E_{ij} + \log(A_i) \\
b_i & \sim N(0, \sigma^2_b) \\
O_{ij} & \sim \textrm{泊松}(\exp(\eta_{ij}))
\结束{拆分}
$$
其中 $i$ 索引 ID 和 $j = \{1,2\}$ 索引 ID 内的观察.
如果您指定模型由限制最大似然(这对于glmmTMB 中的 GLMM 和可能的其他一些包中的 GLMM 是可能的)进行拟合,则此规范完全类似于配对 t 检验,但使用泊松而不是高斯响应。如果您使用最大似然法或贝叶斯方法(更常见),它仍然非常接近等效的“配对泊松 t 检验”。
既然你问如何在 R 中做到这一点:在lme4 (例如)它会是
glmer(observation ~ exposure + offset(log(area)) + (1|ID),
family = poisson,
data = ...)
相似的模型可以安装很多不同的包/功能,一些具有非常相似的接口(@987654324@,glmmTMB::glmmTMB),一些具有不同的接口(@987654326@),一些贝叶斯(MCMCglmm,rstanarm) , brms) 等。