【问题标题】:How to analyze a dataframe with multiple headers?如何分析具有多个标头的数据帧?
【发布时间】:2017-10-08 08:10:20
【问题描述】:

例如,我有一个带有 3 个标题的 df。我想分析来自第一个标题中的一列和第二个标题中的一列的数据。我怎么做?

【问题讨论】:

    标签: python pandas header multiple-columns multi-index


    【解决方案1】:

    很难知道这是否会奏效,因为您尚未提供数据,但您可以试试这个。

    首先访问列名

    data.columns
    

    然后隔离出你要分析的对应列

    data = data[['column_1', 'column_2']]
    

    根据显示为当前列名的名称对列进行索引,忽略当前未使用的列名并仅根据相应的匹配项进行索引。

    然后您可以重命名列。

    data.columns = ['new_column_1_name', 'new_column_2_name']
    

    【讨论】:

      【解决方案2】:

      您可以将它们作为元组拉出:

      In [11]: df = pd.DataFrame([[1, 2], [3, 4]], columns=[["A", "B"], ["a", "b"]])
      
      In [12]: df
      Out[12]:
         A  B
         a  b
      0  1  2
      1  3  4
      
      In [13]: df[[("A", "a")]]
      Out[13]:
         A
         a
      0  1
      1  3
      

      你的情况可能是:

      df[[("Year", "All ages")]]
      

      请参阅advanced section of the docs 了解多索引索引和切片。

      【讨论】:

        猜你喜欢
        • 2021-04-05
        • 2020-04-21
        • 1970-01-01
        • 2019-10-22
        • 2016-02-28
        • 1970-01-01
        • 2020-07-01
        • 2019-06-10
        • 2018-04-05
        相关资源
        最近更新 更多