如果特定行在python的数据框中具有重复值，如何删除整列

【问题标题】：how to remove entire column if a particular row has duplicate values in a dataframe in python如果特定行在python的数据框中具有重复值，如何删除整列
【发布时间】：2018-01-13 07:37:26
【问题描述】：

我有一个这样的数据框，

 df,

        Name    City
   0    sri     chennai
   1    pedhci  pune
   2    bahra   pune

城市列中有重复项。

我试过了：

df["City"].drop_duplicates()

但它只给出特定的列。

我想要的输出应该是

output_df
        Name    City
   0    sri     chennai
   1    pedhci  pune

【问题讨论】：

是否存在删除第 1 行而不是第 2 行的情况？

标签： python pandas dataframe data-analysis

【解决方案1】：

你可以使用：

df2 = df.drop_duplicates(subset='City')

如果您想将结果存储在新的数据框中，或者：

df.drop_duplicates(subset='City',inplace=True)

如果你想更新df。

这会产生：

>>> df
      City    Name
0  chennai     sri
1     pune  pedhci
2     pune   bahra
>>> df.drop_duplicates(subset='City')
      City    Name
0  chennai     sri
1     pune  pedhci

因此，这将只考虑 City 的重复项，Name 中的重复项将被忽略。

【讨论】：