【发布时间】:2016-05-27 14:54:45
【问题描述】:
我有一个如下所示的数据集:
ID FromDate ToDate SiteID Cost
1 8/12/2014 8/31/2014 12 245.98
1 9/1/2014 9/7/2014 12 269.35
1 10/10/2014 10/17/2014 12 209.98
1 11/22/2014 11/30/2014 12 309.12
1 12/1/2014 12/11/2014 12 202.14
2 8/16/2014 8/21/2014 12 109.35
2 8/22/2014 8/24/2014 14 44.12
2 9/25/2014 9/29/2014 12 98.75
3 9/15/2014 9/30/2014 23 536.27
3 10/1/2014 10/31/2014 12 529.87
3 11/1/2014 11/30/2014 12 969.55
3 12/1/2014 12/12/2014 12 607.35
我希望这个看起来像:
ID FromDate ToDate SiteID Cost
1 8/12/2014 9/7/2014 12 515.33
1 10/10/2014 10/17/2014 12 209.98
1 11/22/2014 12/11/2014 12 511.26
2 8/16/2014 8/21/2014 12 109.35
2 8/22/2014 8/24/2014 14 44.12
2 9/25/2014 9/29/2014 12 98.75
3 9/15/2014 9/30/2014 23 536.27
3 10/1/2014 12/12/2014 12 2106.77
如您所见,如果有续期,日期会累计,费用按 ID 和 SiteID 相加。为了帮助人们理解复杂性,如果日期间隔有延续,但 SiteID 发生变化,则它是单独的行。如果日期间隔没有延续,它是一个单独的行。我如何在 R 中做到这一点?另外,我有超过 100,000 个个人 ID。那么最有效的方法/包是什么?
【问题讨论】:
标签: r performance date