【发布时间】:2014-03-03 19:48:06
【问题描述】:
我有一个数据集,其中家庭 ID (hhid) 和成员 ID (mid) 标识了一个唯一的人。我得到了相隔一年的两次独立调查的结果 (surveyYear)。我还有关于此人当时是否入学的数据。
我想要一个二元变量,表示相关个人是否在调查之间辍学(即,如果辍学则为 1,如果仍在学校则为 0)
我对 Stata 有很好的了解,但这个编码挑战似乎有点超出我的能力,因为我不确定如何比较后来的 id 和早期的 id 的在校状态,然后将结果传播到一个二进制列。
这是我需要的示例
以前:
+----------------------------------+
| hhid mid survey~r inschool |
|----------------------------------|
1. | 1 2 3 1 |
2. | 1 2 4 1 |
3. | 1 3 3 1 |
4. | 1 3 4 1 |
5. | 2 1 3 1 |
6. | 2 1 4 0 |
7. | 2 2 3 0 |
8. | 2 2 4 0 |
+----------------------------------+
之后:
+--------------------------------------------+
| hhid mid survey~r inschool dropped |
|--------------------------------------------|
1. | 1 2 3 1 0 |
2. | 1 2 4 1 0 |
3. | 1 3 3 1 0 |
4. | 1 3 4 1 0 |
5. | 2 1 3 1 1 |
6. | 2 1 4 0 1 |
7. | 2 2 3 0 0 |
8. | 2 2 4 0 0 |
+--------------------------------------------+
【问题讨论】:
-
公司在 1985 年左右曾短暂使用过“STATA”这个名称,但从那以后就没有了。无论您从哪个来源获取它都不是很了解!