【发布时间】:2019-07-24 19:50:40
【问题描述】:
我有一个包含一些双胞胎和三胞胎的数据集。对于每组双胞胎或三胞胎,我需要随机选择一个以保留在数据集中。此信息编码在两列中,FamilyID 和 FamilyOrder。双胞胎和三胞胎共享 FamilyID 和 FamilyOrder。非双胞胎兄弟姐妹共享一个 FamilyID,但具有不同的 FamilyOrder 值。
FamilyID FamilyOrder y
1 1 45
1 2 33
2 1 12
3 1 76
3 2 15
3 2 59
3 2 22
4 1 56
4 1 21
因此,在此示例代码中,FamilyID 3 包含一个非双胞胎(编码为 1)和一组三胞胎(编码为 2),而 FamilyID 4 有一对双胞胎。
我希望输出类似于:
FamilyID FamilyOrder y
1 1 45
1 2 33
2 1 12
3 1 76
3 2 22
4 1 56
保留常规兄弟姐妹,但删除每个双胞胎和三胞胎除一个以外的所有兄弟姐妹。
【问题讨论】:
标签: r