【发布时间】:2020-01-29 22:42:07
【问题描述】:
我正在开展一个项目,我们希望对治疗控制数据运行后续线性回归模型,其中治疗已使用 cem 包与控制进行匹配以执行粗化精确匹配:
match <- cem(treatment="cohort", data=df, drop=c("member_id","period","cohort_period"))
est <- att(match, total_cost ~ cohort + period + cohort_period, data = df)
我想估计“cohort_period”交互项的系数和 95% CI。 cem 包中的 att 函数似乎只估计指定处理变量(在本例中为“队列”)的系数,同时调整回归中的其他变量。
有没有办法返回其他回归项的系数和 95% CI?
【问题讨论】:
-
您不应解释模型中的其他系数。他们没有因果解释,因为你没有调整他们的混淆。这被称为表 2 谬误。只有治疗变量具有可解释的效果和 CI。
-
@Noah 因此,如果我继续使用
cem包,如果我有兴趣测量同期群 x 周期交互效应,我是否必须指定treatment="cohort_period"而不是treatment="cohort"差异研究)? -
@Noah 阅读 Westreich & Greenland 关于表 2 谬误的文章,我认为我使用
MatchIt和Zelig包对同期群 x 周期效应的估计可能仍然没有偏见。如果我为我的项目绘制一个因果图,它看起来像:{ period --------> total_cost -
假设这个因果图是真的,并且由于我对混杂变量的无偏估计不感兴趣,只有队列、周期和队列 x 周期,我应该不受表 2 谬误的影响,你不会说吗?
-
哦,我现在同意了。对不起。我假设您希望它用于模型中的其他变量。如果您想要
period的每个级别的子组平均治疗效果,只需确保您对period进行精确匹配,在 PS 模型中包含period(如果使用一个),并包含cohortby @结果模型中的 987654334@ 交互。我认为您的解决方案应该没问题。
标签: r linear-regression