【发布时间】:2019-08-14 11:10:00
【问题描述】:
我正在分析一个按国家/地区划分的数据集,但也包括年龄组和性别群组,包括 5 个年度周期。在这几年之间发生了一次干预。
由于数据稀疏,我想比较每个子组的效果,所以我可能会达到统计显着性(例如,两国的女性都在 10-20 岁之间,我将这个变量称为 ID,每个子组只存在一个数字国家)。
我尝试使用 plm 包进行面板分析,但是,我尝试为国家、年份和 ID 编制索引,但这不起作用,因为它不是唯一的。 是否甚至可以包括国家影响但有国家的子组? (见下面的代码)
我通过使用 lmList 并保存系数来尝试差异差异。这对于通过 ID 分隔的每个子组。 (见下面的代码) 这已经奏效,但在有限的时期内,没有达到统计显着性,即使系数都是相同的方向。所以我想知道是否有可能再次组合这些模型,从而获得可靠的结果?
1. fixed <- plm(FE ~ x , data=df, index=c("ID","country", "year"), model="within")
2. list <- coef(lmList(y~ treated + time + did | ID, data=df))
来自 1 的错误。
duplicate couples (id-time)
In addition: Warning messages:
1: In pdata.frame(data, index) :
duplicate couples (id-time) in resulting pdata.frame
to find out which, use e.g. table(index(your_pdataframe), useNA = "ifany")
2: In is.pbalanced.default(index[[1]], index[[2]]) :
duplicate couples (id-time)
对于 2。 我确实得到了一个包含所有系数的数据框,但是有什么想法可以正确总结或显示这些系数吗?只取一个系数的平均值似乎有点不熟练。
高度赞赏的任何帮助。
【问题讨论】:
标签: r panel-data plm