【发布时间】:2021-04-11 09:24:25
【问题描述】:
解释起来有点麻烦,我尽力了,在下方查询。我有一个 df 如下。我需要根据国家列中的最大流行按组过滤行,但在上述组中尚未发生。 (根据输出(图片),A 之所以没有出现在 group2 中,是因为它已经出现在 Group 1 中)
简而言之,我需要在国家/地区列中获取唯一值,同时在 pop 中获取最大值(在组级别上)。我希望图片能传达我无法传达的信息。 (首选 Tidyverse 解决方案)
[![预期输出][2]][2]
df<- structure(list(Group = c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 3L, 3L), country = c("A", "B", "C", "A", "E", "F", "A", "E", "G"), pop = c(200L, 100L, 50L, 200L, 150L, 120L, 200L, 150L,
100L)), class = "data.frame", row.names = c(NA, -9L))
【问题讨论】:
-
如果G也出现在A组,值为150,那最后的结果会不会一样呢?那么如果一个国家“输”在一个组中,它能否“赢得”另一个价值较低的组?
-
我认为 OP 只想从下一次迭代中消除国家。它的流行值无关紧要!让 Vaibhav 澄清