【发布时间】:2019-01-20 10:46:01
【问题描述】:
我的数据框看起来像这样:
USER URL
1 homepage.com
1 homepage.com/welcome
1 homepage.com/overview
1 homepage.com/welcome
我想要的是一个具有以下值的向量:
UNIQUE
1
2
3
3
我该怎么做?
【问题讨论】:
我的数据框看起来像这样:
USER URL
1 homepage.com
1 homepage.com/welcome
1 homepage.com/overview
1 homepage.com/welcome
我想要的是一个具有以下值的向量:
UNIQUE
1
2
3
3
我该怎么做?
【问题讨论】:
我们可以使用cumsum 和duplicated
df$unique <- cumsum(!duplicated(df$URL))
df$unique
#[1] 1 2 3 3
duplicated 为我们提供了一个值是否重复的逻辑向量,我们将其取反 (!),然后在其上使用 cumsum,这样我们就有了唯一值的累积总和。
【讨论】:
使用dplyr 添加新列:
library(dplyr)
df %>%
mutate(Dups=cumsum(!duplicated(URL)))
【讨论】: