【发布时间】:2022-01-08 11:15:02
【问题描述】:
我有一个包含超过一百万行的以下列:
Emp_ID Start_Date Consec_Days
<int> <date> <dbl>
1 4 2018-02-19 NA
2 4 2018-02-20 1
3 4 2018-02-21 1
4 3 2016-12-26 NA
5 3 2017-01-02 0
6 3 2017-01-03 1
7 3 2017-01-04 1
8 3 2017-01-06 0
9 3 2017-01-07 1
10 3 2017-01-09 0
Start_Date 是员工上班的日期。我想创建一个列来计算每个唯一员工 ID 的平均连续工作天数。每个 NA 值表示特定员工上班的第一天。问题是我不知道如何计算 Consec_Days 列中的 NA 值和 0 以获得连续天数的平均值。
我已尝试参考以下帖子,但未能成功:
How to find mean of n consecutive days in each group r
任何帮助将不胜感激!
【问题讨论】:
-
您能否澄清所需的输出。例如。 'Emp_ID' 4 连续工作三天。这与下面的(接受的)答案不符。