xiaoluoboer

18-09-20 关于Excel 表格重复问题解决示例

 

 代码实现:b=a.drop_duplicates(subset=None, keep=\'first\', inplace=False)

 

 

 


 

 

Excel 去除重复项

在测试过程中,会经常遇到多张表格筛选比对的过程,筛选出的结果导入到一张新表,往往新表中会有许多重复项,我们需要清除这些重复的项,只留下唯一的项即可。
我们可以利用 pandas 库中的 drop_duplicates 方法实现。

函数用法:
DataFrame.drop_duplicates(subset=None, keep=\'first\', inplace=False)

参数
这个 drop_duplicate 方法是对 DataFrame 格式的数据,去除特定列下面的重复行。返回 DataFrame 格式的数据。

subset : 用来指定特定的列,默认所有列

keep : 删除重复项并保留第一次出现的项

inplace:默认 False,在原来数据上修改

 

发表于 2018-11-05 11:37  小萝卜儿  阅读(258)  评论(0编辑  收藏  举报
 

分类:

技术点:

相关文章: