【发布时间】:2018-08-13 16:17:51
【问题描述】:
希望首先识别,然后根据 2 列中的行中的相同值删除重复项。但需要注意的是,我首先要根据其他列进行分组。请帮忙!
这是一个示例数据:
studentid subj topic lesson testtime responsetime
1 1 math add a timestamp1 45sec
2 1 math add a timestamp1 45sec
2 1 math add a timestamp2 30sec
2 1 math add a timestamp3 15sec
2 1 math add b timestamp1 0sec
2 1 math add b timestamp1 0sec
2 1 math add b timestamp1 45sec
2 1 math add b timestamp1 45sec
我希望能够首先查看哪些是重复项,以在按
分组时识别['testtime','responsetime'] 中的任何重复模式
df.groupby(['studentid','subj','topic','lesson').
然后可以放下它们。 在使用 groupby 方法时,我找不到任何有关如何检查然后删除重复项的文档。请帮忙!
【问题讨论】:
-
我应该补充一点,实际的 df 更大,所以我需要指定我只想关注测试时间和响应时间,因为我正在寻找和检查重复的 2 列。
标签: python pandas dataframe group-by duplicates