【发布时间】:2016-12-16 13:02:25
【问题描述】:
我的数据集(df)看起来像,
ID Name Rating Score Ranking
1 abc 3 NA NA
1 abc 3 12 13
2 bcd 4 NA NA
2 bcd 4 19 20
我正在尝试删除使用
的重复项 df <- df[!duplicated(df[1:2]),]
给出,
ID Name Rating Score Ranking
1 abc 3 NA NA
2 bcd 4 NA NA
但我正在努力,
ID Name Rating Score Ranking
1 abc 3 12 13
2 bcd 4 19 20
如何在同时删除重复项时避免包含 NA 的行,一些帮助会很好,谢谢。
【问题讨论】:
-
你试过
complete.cases()吗?您可以先通过complete.cases()过滤,然后删除重复项 -
您也可以使用
order。 NA 将移到最后:df <- df[with(df, order(ID, Score, Ranking)),]; df <- df[!duplicated(df[1:2]),]。
标签: r duplicates na missing-data