【发布时间】:2020-10-08 10:57:17
【问题描述】:
我有一个包含超过 45k 行和 19 个不同变量的大型 csv 数据集。我想通过特定变量(V4)对其进行过滤,以便每个过滤组以 0 开头,然后下一个 0 将标记新组/数据框/数据表的开始,同时将所有其他变量保留在这个新表中好。我需要这些单独的组来进一步分析每个数据案例。 我试过了:
filtered_data <- my_data %>%
group_by("V4") %>%
filter("V4" == 0 & "V4" !=0)
View(filtered_data)
第一个“V4”== 0 似乎有效,但我正在努力如何定义每个过滤数据帧的结尾,例如如何过滤从 0 到 3,然后从 0 到 5 等。 如何确定每个案例的长度?是否有逻辑运算符在 V4 再次变为 0 之前保存每个组?还是创建一个循环会更好?
my_data 示例:
V1 V2 V3 V4 . . . V19
1 0
2 1
3 2
4 ` 3
5 0
6 1
7 2
8 3
9 4
10 5
11 0
...
45k
【问题讨论】:
标签: r dataframe filter group-by datatables