【问题标题】:how to remove entire column if a particular row has duplicate values in a dataframe in python如果特定行在python的数据框中具有重复值,如何删除整列
【发布时间】:2018-01-13 07:37:26
【问题描述】:

我有一个这样的数据框,

 df,

        Name    City
   0    sri     chennai
   1    pedhci  pune
   2    bahra   pune

城市列中有重复项。

我试过了:

df["City"].drop_duplicates()

但它只给出特定的列。

我想要的输出应该是

output_df
        Name    City
   0    sri     chennai
   1    pedhci  pune

【问题讨论】:

  • 是否存在删除第 1 行而不是第 2 行的情况?

标签: python pandas dataframe data-analysis


【解决方案1】:

你可以使用:

df2 = df.drop_duplicates(subset='City')

如果您想将结果存储在新的数据框中,或者:

df.drop_duplicates(subset='City',inplace=True)

如果你想更新df

这会产生:

>>> df
      City    Name
0  chennai     sri
1     pune  pedhci
2     pune   bahra
>>> df.drop_duplicates(subset='City')
      City    Name
0  chennai     sri
1     pune  pedhci

因此,这将只考虑 City 的重复项,Name 中的重复项将被忽略。

【讨论】:

    猜你喜欢
    • 2018-08-23
    • 1970-01-01
    • 2019-11-12
    • 2020-07-08
    • 2013-01-03
    • 1970-01-01
    • 2021-04-01
    • 2015-04-16
    • 1970-01-01
    相关资源
    最近更新 更多