R删除其他列中的重复项[重复]答案

【问题标题】：R deleting duplicates in other columns [duplicate]R删除其他列中的重复项[重复]
【发布时间】：2016-09-01 04:02:32
【问题描述】：

大家好，我之前确实解决了这个问题，但是我丢失了我的代码...... 这是我所拥有的简化。

a1 <- c(1,2,4,3,5)
a2 <- c("a","b","b","c","f")
a3 <- c(3,4,"b",1,9)
a4 <- c("c","b",2,"a","d")
a <- cbind(a1,a2,a3,a4)

a1 和 a2 和 a3 和 a4 一样是一个集合：

我想删除重复项。所以删除第 3 行和第 4 行。这些数据来自显示基因组之间联系的爆炸数据，它有 34,000 行长，所以一个有效的解决方案会很棒。

非常感谢！我也愿意用另一种语言来做这件事。

【问题讨论】：

标签： r

【解决方案1】：

我们可以逐行sort 'a'，获取 not (!) duplicated 元素的逻辑索引并使用它来过滤行。

i1 <- !duplicated(t(apply(a, 1, sort)))
a1 <- a[i1,]

保留在数据集中的行的索引是

which(i1)
#[1] 1 2 5

【讨论】：