【问题标题】:R deleting duplicates in other columns [duplicate]R删除其他列中的重复项[重复]
【发布时间】:2016-09-01 04:02:32
【问题描述】:

大家好,我之前确实解决了这个问题,但是我丢失了我的代码...... 这是我所拥有的简化。

a1 <- c(1,2,4,3,5)
a2 <- c("a","b","b","c","f")
a3 <- c(3,4,"b",1,9)
a4 <- c("c","b",2,"a","d")
a <- cbind(a1,a2,a3,a4)

a1a2a3a4 一样是一个集合:

我想删除重复项。所以删除第 3 行和第 4 行。这些数据来自显示基因组之间联系的爆炸数据,它有 34,000 行长,所以一个有效的解决方案会很棒。

非常感谢!我也愿意用另一种语言来做这件事。

【问题讨论】:

    标签: r


    【解决方案1】:

    我们可以逐行sort 'a',获取 not (!) duplicated 元素的逻辑索引并使用它来过滤行。

    i1 <- !duplicated(t(apply(a, 1, sort)))
    a1 <- a[i1,]
    

    保留在数据集中的行的索引是

    which(i1)
    #[1] 1 2 5
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2015-09-30
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-03-08
      • 1970-01-01
      • 2023-01-11
      • 2016-10-10
      相关资源
      最近更新 更多