【发布时间】:2022-01-17 12:46:16
【问题描述】:
我想保留具有相同 ID 的最新行以及与某些列值匹配的行。样本输入:
ID Timestamp Survey Outcome
12 11/26/2021 INCOMPLETE Survey
95 11/26/2021 INCOMPLETE Survey
95 11/27/2021 COMPLETE Survey
95 11/28/2021 RANG-But did not connect
12 11/29/2021 COMPLETE Survey
24 11/26/2021 RANG-But did not connect
24 11/27/2021 INCOMPLETE Survey
95 11/28/2021 RANG-But did not connect
24 11/28/2021 INCOMPLETE Survey
这里 ID 12 有两个值,所以我将保留最新的 (11/29/2021) 行。但是对于 ID 95,一旦调查完成,它就不能有任何其他选项,例如 rang-but did not connect。因此,我想保留最新的时间戳数据,并保留那些一旦数据完成调查但最新数据显示调查不完整或未连接的行/em>(查看COMPLETE SURVEY后的所有数据)。
所以我的示例输出将是:
ID Timestamp Survey Outcome
95 11/27/2021 COMPLETE Survey
95 11/28/2021 RANG-But did not connect
12 11/29/2021 COMPLETE Survey
95 11/28/2021 RANG-But did not connect
24 11/28/2021 INCOMPLETE Survey```
【问题讨论】:
标签: python pandas dataframe duplicates conditional-formatting