【问题标题】:How to estimate coefficients for linear regression model on CEM matched data using `R` `cem` package?如何使用`R``cem`包估计CEM匹配数据的线性回归模型的系数?
【发布时间】:2020-01-29 22:42:07
【问题描述】:

我正在开展一个项目,我们希望对治疗控制数据运行后续线性回归模型,其中治疗已使用 cem 包与控制进行匹配以执行粗化精确匹配:

match <- cem(treatment="cohort", data=df, drop=c("member_id","period","cohort_period"))
est <- att(match, total_cost ~ cohort + period + cohort_period, data = df)

我想估计“cohort_period”交互项的系数和 95% CI。 cem 包中的 att 函数似乎只估计指定处理变量(在本例中为“队列”)的系数,同时调整回归中的其他变量。

有没有办法返回其他回归项的系数和 95% CI?

【问题讨论】:

  • 您不应解释模型中的其他系数。他们没有因果解释,因为你没有调整他们的混淆。这被称为表 2 谬误。只有治疗变量具有可解释的效果和 CI。
  • @Noah 因此,如果我继续使用 cem 包,如果我有兴趣测量同期群 x 周期交互效应,我是否必须指定 treatment="cohort_period" 而不是 treatment="cohort"差异研究)?
  • @Noah 阅读 Westreich & Greenland 关于表 2 谬误的文章,我认为我使用 MatchItZelig 包对同期群 x 周期效应的估计可能仍然没有偏见。如果我为我的项目绘制一个因果图,它看起来像:{ period --------> total_cost
  • 假设这个因果图是真的,并且由于我对混杂变量的无偏估计不感兴趣,只有队列、周期和队列 x 周期,我应该不受表 2 谬误的影响,你不会说吗?
  • 哦,我现在同意了。对不起。我假设您希望它用于模型中的其他变量。如果您想要period 的每个级别的子组平均治疗效果,只需确保您对period 进行精确匹配,在 PS 模型中包含period(如果使用一个),并包含cohort by @结果模型中的 987654334@ 交互。我认为您的解决方案应该没问题。

标签: r linear-regression


【解决方案1】:

想通了!我使用了错误的包 - 而不是 cem 我发现 MatchItZelig 包允许我对匹配的数据执行精确匹配和参数回归:

library(MatchIt)
library(Zelig)

matched_df <- matchit(cohort ~ age_catg + sex + market_code + risk_score_catg, method="exact", data=df)
matched_df_reg <- zelig(total_cost ~ cohort + period + cohort_period, data = match.data(matched_df), model = "ls")

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-06-10
    • 2020-06-28
    • 1970-01-01
    • 2021-05-25
    • 2021-01-02
    • 2019-09-29
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多