【发布时间】:2020-02-24 23:43:48
【问题描述】:
我有以下数据。
date var1 level score_1 score_2
2020-02-19 12:10:52.166661 dog n1 1 3
2020-02-19 12:17:25.087898 dog n1 3 6
2020-02-19 12:34:27.624939 dog n2 4 3
2020-02-19 12:35:50.522116 cat n1 2 0
2020-02-19 12:38:49.547181 cat n2 3 4
对于任何组合 var1 & level 都应该只有一个观察值。我想消除重复并只保留最近的记录。在前面的例子中,第一行应该被删除,因为第 2 行的 dog-n1 是最近的。不过,我想保留第 3 行,即使 var1 也等于“dog”,因为级别不同。
那么,我想得到什么:
date var1 level score_1 score_2
2020-02-19 12:17:25.087898 dog n1 3 6
2020-02-19 12:34:27.624939 dog n2 4 3
2020-02-19 12:35:50.522116 cat n1 2 0
2020-02-19 12:38:49.547181 cat n2 3 4
【问题讨论】:
标签: r duplicates