【发布时间】:2019-02-18 00:31:15
【问题描述】:
我正在尝试“突出显示”我的数据框中的重复项。我找到了有关删除重复项或创建仅包含重复项的新数据集的各种教程。但由于我预计在我的数据工作的早期阶段会出现问题,我(现在)只想看看哪些观察结果似乎是重复的,以便了解出了什么问题。我希望 R 创建列 c
a <- c("C","A","A","B","A","C","C")
b <- c(1,1,2,1,2,1,2)
c <- c(2,1,2,1,2,2,1)
df <-data.frame(a,b,c)
【问题讨论】:
-
您要检测重复的依据是什么?对于 a 列、b 列还是两者都有?
-
我认为您在第 5 行中的
c值是错误的,因为 A - 2 组合出现了两次。 -
@AntoniosK:是的,你当然是对的!
标签: r sorting duplicates