【发布时间】:2019-05-28 07:12:05
【问题描述】:
数据框如下所示:
df = pd.DataFrame({'k1':['one']*3 + ['two']*4,'k2':[1,1,2,3,3,4,4]})
当我检查重复项时,我通过做得到布尔索引
df.duplicated(),然后我用它作为过滤器
df[df.duplicated()] 与 df.drop_duplicates() 相比显示不同的结果
在结果中创建了一个额外的行
2 one 2
【问题讨论】: