【问题标题】:How to save duplicates only?如何仅保存重复项?
【发布时间】:2021-03-21 01:45:36
【问题描述】:

我编写了代码以从我的 xlsx 文件中的 col 中删除重复项。

import pandas as pd
from openpyxl.workbook import Workbook


def delete_duplicates(nazov_suboru, cielovy_subor,riadok):
    data = pd.read_excel(nazov_suboru)
    print("chvilelenku pockaj")
    data.drop_duplicates(subset=[riadok], keep=False, inplace=True)
    data.to_excel(cielovy_subor, index=False)
    print("done")

它保存唯一的数据。但我需要相反的。只保存重复的。想不通。请有任何想法/

【问题讨论】:

    标签: python excel pandas xlsx


    【解决方案1】:
    data = data[data.duplicated(subset=[riadok], keep=False)]
    

    将保留重复的行。

    pandas.DataFrame.duplicated

    【讨论】:

    • 不会是keep="last" 只保存重复的对象吗?
    • last :将重复项标记为 True,但最后一次出现除外。 False :将所有重复项标记为 True。 @TheLazyScripter Op 希望保留重复的
    • 啊,我明白了。感谢您的澄清!
    猜你喜欢
    • 2017-05-28
    • 2012-11-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-01-17
    • 1970-01-01
    • 1970-01-01
    • 2020-12-03
    相关资源
    最近更新 更多