【发布时间】:2018-06-17 18:31:49
【问题描述】:
示例数据框:
import pandas as pd
data = data = { 'num1': [1,2,3,4,5],
'num2': [1,1,2,3,1],
'num3': [5,4,3,2,1]}
df = pd.DataFrame(data)
print(df.head())
>>> df.head()
num1 num2 num3
0 1 1 5 #dups with row 4
1 2 1 4
2 3 2 3
3 4 3 2
4 5 1 1 #dups with row 1
在这个示例数据框中,我试图提取第一行和最后一行, 因为它们的内容彼此重复 (1,1,5)
如果值的顺序相同,下面的代码只会找到重复的行(看起来):
dups =df[df.duplicated(subset=None, keep='first')]
因此导致一个空数据集。
谢谢。
【问题讨论】: