【问题标题】:Drop rows from dataframe where problematic values are in separate list从数据框中删除有问题的值位于单独列表中的行
【发布时间】:2020-01-30 06:02:45
【问题描述】:

我有一个问题行列表,其中有一个唯一标识符,我想从数据框中删除所有这些行。

我试过用 loc 来索引它们,如下:

df.loc[df['GUID'] != toDel['GUID']]

其中 df 是 5063 行 x 28 列,toDel['GUID'] 是我要从 df 中删除的 GUID 列表。

我希望这会给我一个不包含有问题的行的 df。但是,我得到一个“valueError:只能比较标签相同的系列对象”。我想这意味着它们必须是相同大小的系列,但是如何使用这个 toDel['GUID'] 列表来摆脱有问题的 GUID?

【问题讨论】:

    标签: python pandas pandas-loc


    【解决方案1】:

    要仅保留 GUID 位于 toDel['GUID'] 中的行,您可以这样做

    df.loc[df['GUID'].isin(toDel['GUID'])]
    

    【讨论】:

      猜你喜欢
      • 2021-01-22
      • 1970-01-01
      • 2022-11-04
      • 2011-03-15
      • 2021-06-23
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-08-18
      相关资源
      最近更新 更多