【发布时间】:2021-04-19 10:55:32
【问题描述】:
我有一个数据框来衡量每月的登录次数。我正在尝试创建一个测量 months_since_zero_login 的计数器,它仅在一个月内的登录数为零时添加。第一个月,每个客户的柜台将从零开始。
这是数据:
library(tidyverse)
obs <- seq(as.Date('2020-01-01'),
as.Date('2020-05-01'),
by = "month")
table <- tibble(customer = seq(1:3))
#output
table <- table %>%
crossing(obs) %>%
mutate(login = c(3, 0, 0, 0, 2,
0, 1, 5, 0, 0,
1, 3, 1, 5, 0))
这是预期的结果:
customer obs login months_since_zero_login
<int> <date> <dbl> <dbl>
1 1 2020-01-01 3 0
2 1 2020-02-01 0 0
3 1 2020-03-01 0 1
4 1 2020-04-01 0 2
5 1 2020-05-01 2 0
6 2 2020-01-01 0 0
7 2 2020-02-01 1 0
8 2 2020-03-01 5 0
9 2 2020-04-01 0 0
10 2 2020-05-01 0 1
11 3 2020-01-01 1 0
12 3 2020-02-01 3 0
13 3 2020-03-01 1 0
14 3 2020-04-01 5 0
15 3 2020-05-01 0 0
到目前为止,这是我的代码,但是当有连续的零时(对于客户 1),我不知道如何将计数器增加 1
table %>%
group_by(customer) %>%
mutate(months_since_zero_login = case_when(
row_number() == 1 ~ 0,
lag(login) == 0 & login == 0 ~ 1,
TRUE ~ 0
))
#does not increase counter when there are consecutive zeroes
【问题讨论】: