【发布时间】:2021-06-15 16:08:54
【问题描述】:
我很接近,但语法不正确。我正在尝试根据基于第三个最大值的两个变量(列)的唯一组合的选择来选择数据表的所有列。 MWE 的进展至今。谢谢。 J
library(dplyr)
dt1 <- tibble (var1 = c("num1", "num2", "num3", "num4", "num5"),
var2 = rep("A", 5),
var3 = c(rep("B", 2), rep("C", 3)),
var4 = c(5, 10, 3, 7, 19))
dt1 %>% distinct(var2, var3, max(var4), .keep_all = TRUE)
# A tibble: 2 x 5
var1 var2 var3 var4 `max(var4)`
<chr> <chr> <chr> <dbl> <dbl>
1 num1 A B 5 19
2 num3 A C 3 19
这很接近,但我想要 var4 的值是最大值的行,在 var2 和 var3 的唯一组合内。我正在尝试获取:
# A tibble: 2 x 5
var1 var2 var3 var4 `max(var4)`
<chr> <chr> <chr> <dbl> <dbl>
1 num2 A B 5 10
2 num5 A C 3 19
distinct 函数的第三个参数需要公式吗?
【问题讨论】: