【发布时间】:2018-04-08 01:50:07
【问题描述】:
我有一个类似以下的数据框:
ID STATUS
1638483 Very bad
1407499 Very good
1383920 Good
1407499 Bad
第一列包含ID,有些是唯一的,有些则不是。
第二列包含STATUS,可以是:"Very good"、"Good"、"Bad" 或"Very Bad"。
我想:
-
保留具有唯一
ID的行(STATUS在这里无关紧要):例如具有ID1638483或1383920的行, -
只为具有非唯一
ID的行选择具有最佳状态的行:例如具有ID1407499的行
期望的输出是:
ID STATUS
1638483 Very bad
1407499 Very good
1383920 Good
我尝试使用dplyr 包。
我成功按ID 对数据进行分组,但后来卡住了。
【问题讨论】: