【发布时间】:2021-03-01 14:05:54
【问题描述】:
我有一个列名类似于下面的数据框,其中每一行都是一个观察值: 用户身份;日期;变量_1; Var_2
对于每个日期,每个 user_id 可以有 0 或 1 个观察值。每个用户的数据框中只包含有观察的日期。
根据这些数据,我想创建一个包含这些变量(以及下面描述的变量)的数据框,但它应该只包含 3 个连续日期的观察结果(对于每个用户)。每个连续的天数应该从 1 到 3 编号,并且每个连续也应该编号。
例如,如果 user_id == 1 的用户在以下日期有观察:2020-01-01、2020-01-03、2020-01-04、2020-01-05、2020-01-06、2020 -01-10、2020-01-12、2020-01-13、2020-01-14。 user_id == 2 的用户在以下日期有观察结果:2020-01-01、2020-01-03、2020-01-04、2020-01-06、2020-01-10、2020-01-12、 2020-01-15、2020-01-16、2020-01-17
那么新的数据框应该包括:
user_id 日期 序列 天 Var_1 Var_2
1 20-01-03 1 1 值 值
1 20-01-04 1 2 价值 价值
1 20-01-05 1 3 值 值
1 20-01-04 2 1 值 值
1 20-01-05 2 2 值 值
1 20-01-06 2 3 价值 价值
1 20-01-12 3 1 值 值
1 20-01-13 3 2 值 值
1 20-01-14 3 3 值 值
2 20-01-15 1 1 值 值
2 20-01-16 1 2 值 值
2 20-01-17 1 3 值 值
(其中 value 是变量的观察值)
感谢您对这个棘手问题的帮助!
最好的祝愿, 埃里克
【问题讨论】:
-
请使用
dput或我们可以复制和使用的东西添加数据。还显示共享数据的预期输出。了解how to ask a good question 和how to give a reproducible example。