【发布时间】:2020-04-27 10:18:59
【问题描述】:
我遇到了一个子集问题,我被困住了。这是数据的sn-p:
UniqueID MonthYear FirstObs
ABC123 OCT-18 1
ABC123 NOV-18 0
ABC123 JAN-19 0
ABC123 FEB-19 0
DEF446 MAY-19 1
DEF456 JUN-19 0
DEF456 JUL-19 0
GHI789 OCT-18 1
GHI789 NOV-18 0
数据集非常大,有一系列类似于上述示例的行。我希望能够编写一个子集公式,该公式提取具有相同 UniqueID 块的每一行,以 FirstObs=1 开头,并根据它们起源的月份将它们放在一起。我会有类似以下的内容:
Subset1 (all uniqueIDs that originated in October)
UniqueID MonthYear FirstObs
ABC123 OCT-18 1
ABC123 NOV-18 0
ABC123 JAN-19 0
ABC123 FEB-19 0
GHI789 OCT-18 1
GHI789 NOV-18 0
Subset2 (all uniqueIDs that originated in May)
UniqueID MonthYear FirstObs
DEF446 MAY-19 1
DEF456 JUN-19 0
DEF456 JUL-19 0
理想情况下,每个月以 FirstObs=1 开头的每个块都有一个子集。我知道我需要使用一些 ifelse 和子集函数系列,但我不确定如何以最佳方式使用它们。
【问题讨论】:
标签: r if-statement subset