计算上面所有行的唯一值的数量[重复]

【问题标题】：Count number of unique values for all rows above [duplicate]计算上面所有行的唯一值的数量[重复]
【发布时间】：2019-01-20 10:46:01
【问题描述】：

我的数据框看起来像这样：

USER URL
1    homepage.com
1    homepage.com/welcome
1    homepage.com/overview
1    homepage.com/welcome

我想要的是一个具有以下值的向量：

UNIQUE
1
2
3
3

我该怎么做？

【问题讨论】：

标签： r unique

【解决方案1】：

我们可以使用cumsum 和duplicated

df$unique <- cumsum(!duplicated(df$URL))
df$unique
#[1] 1 2 3 3

duplicated 为我们提供了一个值是否重复的逻辑向量，我们将其取反 (!)，然后在其上使用 cumsum，这样我们就有了唯一值的累积总和。

【讨论】：

【解决方案2】：

使用dplyr 添加新列：

library(dplyr)
df %>% 
  mutate(Dups=cumsum(!duplicated(URL)))

【讨论】：