【发布时间】:2021-11-14 06:34:20
【问题描述】:
我正在尝试过滤数据框中只有一种类型的值与之关联的组。我想这很简单。这是我的数据框:-
example<-structure(list(UserID = c("AAA", "AAA", "AAA", "AAA", "AAA",
"AAA", "AAA", "AAA", "AAA", "BBB", "BBB", "BBB", "BBB", "BBB",
"BBB", "BBB", "BBB", "CCC", "CCC", "CCC", "CCC", "CCC", "CCC",
"CCC", "DDD", "DDD", "DDD", "DDD", "DDD", "DDD", "DDD", "DDD",
"DDD", "DDD", "DDD"), Status = c("Cluster 1", "Cluster 1", "Cluster 1",
"NotActive", "NotActive", "Cluster 1", "Cluster 2", "Cluster 2",
"Cluster 2", "NotActive", "NotActive", "NotActive", "NotActive",
"NotActive", "NotActive", "NotActive", "NotActive", "NotActive",
"NotActive", "NotActive", "NotActive", "Cluster 1", "Cluster 1",
"NotActive", "NotActive", "NotActive", "NotActive", "NotActive",
"NotActive", "NotActive", "NotActive", "NotActive", "NotActive",
"NotActive", "NotActive")), row.names = c(NA, -35L), class = c("tbl_df",
"tbl", "data.frame"))
基本上,我想过滤掉只有一种状态称为“NotActive”的组。一些用户混合了“Cluster _”和“NotActive”,我想保留这些。
我有一个包含数千个组的大型数据集,需要过滤掉,所以它不像示例中那样过滤掉UserID BBB 和 DDD 那么简单,所以可以在更大范围内应用一些东西。像 AAA 和 CCC 这样的用户 ID 应保留包含“NotActive”在内的混合值,只有具有“NotActive”作为状态的用户才能保留
任何指针都会很棒:)
【问题讨论】: