【发布时间】:2019-04-09 21:55:35
【问题描述】:
我有一个这样的熊猫数据框:
a b c
0 1 1 1
1 1 1 0
2 2 4 1
3 3 5 0
4 3 5 0
其中前 2 列('a' 和 'b')是 ID,而最后一列('c')是验证(0 = neg,1 = pos)。我确实知道如何根据前 2 列的值删除重复项,但是在这种情况下,我还想删除不一致的数据,即验证为正数和负数的重复数据。因此,例如,前 2 行重复但不一致,因此我应该删除整个记录,而最后 2 行既重复又一致,因此我将保留其中一条记录。预期结果应该是:
a b c
0 2 4 1
1 3 5 0
真实的数据框每组可以有两个以上的重复项,并且 如您所见,索引也已更改。谢谢。
【问题讨论】:
标签: python python-3.x pandas