【问题标题】:Remove rows where a column contains a specific substring [duplicate]删除列包含特定子字符串的行[重复]
【发布时间】:2020-09-27 22:25:29
【问题描述】:

如何消除包含我不想要的单词的rown? 我有这个数据框:

index  price    description
0      15       Kit 10 Esponjas Para Cartuchos Jato De Tinta ...
1      15       Snap Fill Para Cartuchos Hp 60 61 122 901 21 ...
2      16       Clips Para Cartuchos Hp 21 22 60 74 75 92 93 ...

我正在尝试删除带有“esponja”一词的行

我想要这样的 DataFrame:

index  price    description
    1      15       Snap Fill Para Cartuchos Hp 60 61 122 901 21 ...
    2      16       Clips Para Cartuchos Hp 21 22 60 74 75 92 93 ...

我是新手,我不知道如何解决这个问题

【问题讨论】:

    标签: python pandas dataframe


    【解决方案1】:

    通过检查包含'Esponjas' 的字符串来创建一个布尔掩码,然后使用否定掩码索引到您的数据帧中。

    df[~df['description'].str.contains('Esponjas')]
    

    如果你不确定发生了什么,打印出来

    df['description']
    df['description'].str.contains('Esponjas')
    ~df['description'].str.contains('Esponjas')
    

    自己做。如果要执行不区分大小写的子字符串检查,请使用case=False 作为str.contains 的关键字参数。

    【讨论】:

    • 我会添加 case=False 以忽略此情况
    • @Datanovice 谢谢,好建议。
    • 非常感谢您的关注
    猜你喜欢
    • 2016-01-05
    • 2020-02-04
    • 1970-01-01
    • 2016-07-16
    • 2021-03-17
    • 2021-09-17
    • 2022-10-24
    • 2012-03-21
    • 1970-01-01
    相关资源
    最近更新 更多