熊猫删除匹配的列[重复]答案

【问题标题】：Pandas to delete matched columns [duplicate]熊猫删除匹配的列[重复]
【发布时间】：2018-08-03 23:32:41
【问题描述】：

我的工作簿中有多个列的 Excel 工作表。这些列包含不同的标题。其中一些可能拥有相同的数据。这些报告是使用 pandas 生成的。如何比较每张纸上的所有列，以及这些列中的任何一个上的数据是否相同删除。标题是

2014  2015  2016 2017  2018
12.    14.  12.   15.   20
11.    11.  11.   12.   21

您可以看到 2014 年和 2016 年的数据相同。如果匹配 2014，如何删除 2016？我有多张多年的工作表。

【问题讨论】：

谢谢，但是我忘了说每列是 2014 年，然后在指标名称下然后是数据。如果列名仅为 2014，则 T 删除将起作用。任何帮助将不胜感激 mazin
@Mazin 请编辑问题本身，而不是对您应该或不应该写的内容提出问题。

标签： python pandas

【解决方案1】：

给你：

   import pandas as pd
   import numpy as np 

   data = {'2012': ['1', '2', '3', '4', '5'], '2013': ['2', '2', '2', '2', 
           '2'], '2014': ['1', '2', '3', '4', '5']}
   df = pd.DataFrame(data, columns=['2012', '2013', '2014'])

   results = df.T.drop_duplicates().T

【讨论】：

Ind1 Ind1 Ind1 Ind1 Ind2 Ind2 Ind2 2014 2015 2016 2017 2014 2015 2016 dhb1 2 3 2 3 2 3 2 dhb2 2 3 2 3 2 3 2 我需要删除 Ind1 2016 年和 20 年下的数据和 Ind2 2016 年，因为它们等于同一指标下的另一列。谢谢