【发布时间】:2010-11-27 14:27:00
【问题描述】:
我们正在开展一项社会资本项目,因此我们的数据集包含个人的组织成员列表。因此,每个人都会获得一个数字 ID,然后是他们所在的每个组的子 ID。因此,分析单位是他们所在的组。我们的变量之一是针对其所在组类型的三点量表。听起来很简单?
我们希望将分析单元带到个人层面,并将其所属的群体类型浓缩为一个变量,表示他们所处的不同类型群体的数量。
例如,第一个人分为八组。在这些组中,三个是(1s),三个是(2s),两个是(3s)。理想情况下,个人水平变量应该是 3,因为她属于所有三种类型的组。
这至少可能吗?
【问题讨论】:
-
添加实际样本数据将为您提供更好的答案。我可以想到 3 种看似显而易见的方法,但答案取决于数据的形成方式。你的每一行数据都是一个人吗?如果是这样,是否有一堆用于 subID 的 if 字段?还是每一行都是 person + subid 的组合。
-
京东说的。但是请参阅我的答案以了解如何生成虚假数据,并且可能会对其进行更改以适合您拥有的数据。
-
爱德华多,你是一个很好的堆栈溢出公民。
标签: r