【发布时间】:2020-11-27 00:24:46
【问题描述】:
所以我遇到了以下问题:我有以下形式的数据框:
ID Date Var1
1 20200101 0
1 20200102 0
1 20200103 0
1 20200104 0
1 20200104 0
2 20200101 0
2 20200102 0
2 20200103 4
2 20200104 7
2 20200105 13
我想定义一个额外的变量,如果 Var1 在 1 月份 (20200101:20200131) 首次 > 0,则取 1,否则取 0,关于 ID。实际的数据库分布在 6 个月内,Var1 是一个运行总数,所以如果一次 > 0,它就不会再减少了。
所以最终的帧应该是这样的:
ID Date Var1 new_var
1 20200101 0 0
1 20200102 0 0
1 20200103 0 0
1 20200104 0 0
1 20200104 0 0
2 20200101 0 1
2 20200102 0 1
2 20200103 4 1
2 20200104 7 1
2 20200105 13 1
感谢您的所有回答!
【问题讨论】:
-
为什么你有
2 20200101 0 1?不应该是 0? -
@Duck 不,它应该是一个,因为该组在一月份 Var1 > 0 的条件是正确的
标签: r if-statement dplyr conditional-statements