【发布时间】:2018-10-21 11:10:04
【问题描述】:
我有一个数据框,其中包含 id(包含重复)、日期(包含重复)、值。这些值被记录为不同的连续天数。现在我想要的是用 id 和日期(连续 n 天)对数据框进行分组并找到值的平均值。如果最后一组不包含 n 天,则返回 NA。
id date value
1 2016-10-5 2
1 2016-10-6 3
1 2016-10-7 1
1 2016-10-8 2
1 2016-10-9 5
2 2013-10-6 2
. . .
. . .
. . .
20 2012-2-6 10
连续 n 天为 3 的期望输出
id date value group_n_consecutive_days mean_n_consecutive_days
1 2016-10-5 2 1 2
1 2016-10-6 3 1 2
1 2016-10-7 1 1 2
1 2016-10-8 2 2 NA
1 2016-10-9 5 2 NA
2 2013-10-6 2 1 4
.
.
.
.
20 2012-2-6 10 6 25
【问题讨论】:
-
到目前为止你有什么尝试?
-
尝试使用 group_by(id,group_end_date=cut("date","n days")) 并使用循环删除 NA
标签: r group-by dplyr plyr lubridate