【发布时间】:2014-06-24 12:40:05
【问题描述】:
我有一个面板数据集,我想删除在第一轮调查中年龄在 40 岁及以上的受访者。
我尝试做drop if age>40 和drop if age>40 & t==1,其中 t 是该人所在调查波的标识符。但是,当我做第二个时,剩下的人是 40 岁以上的人。
以下是我的数据的示例:
pid age wave year of survey
1 20 1 2005
1 21 2 2006
1 22 3 2007
1 23 4 2008
2 37 1 2006
2 38 2 2007
2 39 3 2008
2 40 4 2009
3 40 1 2008
3 41 2 2009
3 42 3 2010
3 43 4 2011
我的目标是不要失去第三位受访者,因为他/她在第一次接受调查时属于我的目标年龄组,但他们不在接下来的调查年份(而不是仅仅留下他/她的第一波如果我只是简单地做drop if age<=40,则删除其他 3 个数据并删除正在执行的操作)。
是否有另一种方法可以只留下 40 岁以下的人,而在第一波中保留 40 岁的人,即使他们在随后的波中 41 岁、42 岁等?我基本上想将我的小组限制在 40 岁以下的年龄组中,同时保留那些 40 岁但在随后的一波中可能超过 40 岁的人(我只有 4 波)。
【问题讨论】:
-
我在此处删除了经济学标签,因为我认为它没有帮助。