【问题标题】:Remove items from dataframe faster [duplicate]更快地从数据框中删除项目[重复]
【发布时间】:2019-12-13 18:48:59
【问题描述】:

我有一个相当大的数据框,我需要从中删除值。我目前使用此代码:

for sha in shas:
        df = df[~df['SHA256'].str.contains(sha, regex=False)]

但是,如果 shas 变得足够大,这将无法很好地扩展。 有没有更高效、更快捷的方式从数据框中删除元素?

【问题讨论】:

  • df[~df['SHA256'].str.contains('|'.join(shas), regex=True)] 怎么样?

标签: python pandas


【解决方案1】:

您可能希望使用 isin() 方法而不是循环。

df = df[~df['SHA256'].isin(shas)]

编辑:此解决方案仅适用于具有完全匹配的值。如果您想要包含其他值的值的解决方案,请检查this solution

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-05-08
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-11-09
    • 1970-01-01
    • 2023-04-07
    相关资源
    最近更新 更多