【发布时间】:2021-10-05 00:14:23
【问题描述】:
我想基于以下两个数据框创建一个新的数据框(reports_before_after_AC_clusters):
- AC 事件数据框
tail(AC_clusters)
Park Date Cluster
<chr> <date> <dbl>
1 Arbour Lake East 2019-07-08 1
2 Arbour Lake East 2019-07-09 1
3 Arbour Lake East 2019-07-10 1
4 Winston-Victoria Park 2021-07-09 1
5 Winston-Victoria Park 2021-09-10 2
6 Winston-Victoria Park 2021-09-16 2
其中“Park”是举办 AC 活动的公园,“cluster”代表一组 AC 活动,其中每个活动距离上一个活动不到 30 天。
- 报告数据框
tail(Reports_per_park_per_day_2)
Park Date
<chr> <date>
1 Arbour Lake East 2019-07-02
2 Arbour Lake East 2019-07-05
3 Arbour Lake East 2019-07-20
4 Winston-Victoria Park 2021-07-02
5 Winston-Victoria Park 2021-09-08
6 Winston-Victoria Park 2021-09-22
此数据框中的公园与上一个数据框中的公园相同,但报告未分类。
我想创建一个新的数据框,其中包括发生 AC 事件的公园、AC 事件的集群(例如 1)、集群中第一个 AC 事件的日期(数据框 1)、集群中最后一个 AC 事件的日期(数据框 1),该集群中 AC 事件的数量(数据框 1),该集群中第一个 AC 事件前 2 周的报告数量(数据框 1 和 2),以及该集群中最后一个 AC 事件后 2 周的报告数量(数据框 1 和 2)。
根据上面提供的数据框,我想要的数据框应该如下所示:
#reports_before_after_AC_clusters#
Park Cluster Start_date End_date Number_AC Number_reports_before Number_reports_after
Arbour Lake East 1 2019-07-08 2019-07-10 3 2 1
Winston-Victoria Park 1 2021-07-09 2021-07-09 1 1 0
Winston-Victoria Park 2 2021-09-10 2021-09-16 2 1 1
【问题讨论】:
-
到目前为止你尝试过什么?您是方言不可知论者,还是更喜欢 tidyverse 或 base R 或 data.table 或 ...?
-
我喜欢 tidyverse!我没有尝试太多。我是 R 新手,所以任何建议都将不胜感激!
标签: r