【发布时间】:2022-01-17 23:40:26
【问题描述】:
在Stata中,我想根据另一个变量unemp的中值创建一个二进制变量median_unemp,将中值的计算按region和year分组。也就是说,median_unemp 在特定观察的失业率大于该地区和观察年份的失业率中位数时为 1(否则为 0)。
下面的代码会根据整个数据集生成我的变量,但我希望按子组计算中位数(通过region 和year):
webuse productivity.dta, clear
summarize unemp, detail
gen median_response = r(p50)
gen median_unemp = (unemp>=median_response)
replace median_unemp =. if unemp==.
在仔细检查数据后,我想知道 unempfor 我的数据集的观察 1(即在 region=1 和 year=1970 中)是否大于 median_unemp 的值(针对region=1 和year=1970 计算)等等。如果大于中位数,则median_unemp==1。如果低于中位数,则median_unemp==0。
【问题讨论】:
标签: group-by binary stata median dummy-variable