【问题标题】:Setting DataFrame column headers to a MultiIndex将 DataFrame 列标题设置为 MultiIndex
【发布时间】:2013-08-18 05:58:34
【问题描述】:

如何将具有单级列的现有数据框转换为具有分层 index 列 (MultiIndex)?

示例数据框:

In [1]:
import pandas as pd
from pandas import Series, DataFrame

df = DataFrame(np.arange(6).reshape((2,3)),
               index=['A','B'],
               columns=['one','two','three'])
df
Out [1]:
   one  two  three
A    0    1      2
B    3    4      5

我原以为 reindex() 会起作用,但我得到的是 NaN:

In [2]:
df.reindex(columns=[['odd','even','odd'],df.columns])
Out [2]:
   odd  even    odd
   one   two  three
A  NaN   NaN    NaN
B  NaN   NaN    NaN

如果我使用 DataFrame() 也一样:

In [3]:
DataFrame(df,columns=[['odd','even','odd'],df.columns])
Out [3]:
   odd  even    odd
   one   two  three
A  NaN   NaN    NaN
B  NaN   NaN    NaN

如果我指定 df.values,最后一种方法确实有效:

In [4]:
DataFrame(df.values,index=df.index,columns=[['odd','even','odd'],df.columns])
Out [4]:
   odd  even    odd
   one   two  three
A    0     1      2
B    3     4      5

这样做的正确方法是什么?为什么 reindex() 会给出 NaN?

【问题讨论】:

    标签: python pandas multi-index


    【解决方案1】:

    你已经很接近了,只需将列直接设置为一个新的(大小相等的)类似索引(如果它是列表列表将转换为多索引)

    In [8]: df
    Out[8]: 
       one  two  three
    A    0    1      2
    B    3    4      5
    
    In [10]: df.columns = [['odd','even','odd'],df.columns]
    
    In [11]: df
    Out[11]: 
       odd  even    odd
       one   two  three
    A    0     1      2
    B    3     4      5
    

    Reindex 将重新排序/过滤现有索引。你得到所有 nans 的原因是你在说,嘿找到与这个新索引匹配的现有列;没有匹配,所以这就是你得到的

    【讨论】:

    • 如果要使用 numpy 数组,请先将其转换为列表:df.columns = list(a)
    猜你喜欢
    • 2017-04-28
    • 2019-04-05
    • 2013-03-22
    • 2016-07-21
    • 2020-08-17
    • 2019-08-06
    • 2020-08-14
    • 2021-06-16
    • 2016-11-06
    相关资源
    最近更新 更多