【发布时间】:2021-03-30 07:13:52
【问题描述】:
我有以下 df 结构:
category difference factor
a -0.12 1
a -0.12 2
b -0.17 3
b -0.21 4
我想对这些数据进行分类,以便我可以通过数字分别标识每个类别,并根据递减的差异对它们进行排名。预期的结果是这样的:
category difference factor catCount rank
a -0.12 1 2 2
a -0.12 2 2 1
b -0.17 3 1 2
b -0.21 4 1 1
我正在使用以下代码来实现这一点:
df %>% group_by(category) %>% mutate(categoryNumber = n_distinct(category)) %>% mutate(rank = rank(difference, ties.method = 'last'))
但输出如下:
category difference factor catCount rank
a -0.12 1 2 2
a -0.12 2 2 1
b -0.17 3 2 2
b -0.21 4 2 1
对此有何建议?
【问题讨论】:
-
为什么“a”类别的 catCount 为 2 而“b”为 1?数字重要还是您需要任何唯一的数字?