Pandas 使用列表向列添加二级索引答案

【问题标题】：Pandas add a second level index to the columns using a listPandas 使用列表向列添加二级索引
【发布时间】：2021-10-15 09:29:33
【问题描述】：

我有一个带有列标题的数据框（以及我的真实数据多级行索引）。我想根据我拥有的列表向列添加二级索引。

import pandas as pd

data = {"apple": [7,5,6,4,7,5,8,6],
       "strawberry": [3,5,2,1,3,0,4,2],
       "banana": [1,2,1,2,2,2,1,3],
        "chocolate" : [5,8,4,2,1,6,4,5],
        "cake":[4,4,5,1,3,0,0,3]
       }

df = pd.DataFrame(data)
food_cat = ["fv","fv","fv","j","j"]

我想要这样的东西：

我尝试使用 How to add a second level column header/index to dataframe by matching to dictionary values? - 但是无法使其正常工作（而且不理想，因为我需要弄清楚如何自动化字典，而我没有）。

我还尝试将列表添加为数据框中的一行并将该行转换为二级索引，如 this answer 使用

df.loc[len(df)] = food_cat
df = pd.MultiIndex.from_arrays(df.columns, df.iloc[len(df)-1])

但得到了错误 检查所有数组的长度是否相等， TypeError: Input must be a list / sequence of array-likes.

我也尝试将df = pd.MultiIndex.from_arrays(df.columns, np.array(food_cat)) 与import numpy as np 一起使用，但得到了同样的错误。

我觉得这应该是一个简单的任务（它是针对行的），并且有很多问题被问到，但我很难找到可以复制的东西以适应我的数据。

【问题讨论】：

为什么不直接使用：df.columns = pd.MultiIndex.from_arrays([food_cat, df.columns])
pd.MultiIndex.from_arrays 第一个参数，arrays 是一维“类数组”对象的列表。
感谢@sammywemmy，如果您将其发布为我会接受的答案。在我放弃并发布之前，我花了几个小时试图找到一个工作示例。我并不惊讶它真的很简单。

标签： python pandas multi-index

【解决方案1】：

Pandas 多索引创建需要一个列表（或类似列表）作为参数传递：

df.columns = pd.MultiIndex.from_arrays([food_cat, df.columns])

df

     fv                           j
  apple strawberry banana chocolate cake
0     7          3      1         5    4
1     5          5      2         8    4
2     6          2      1         4    5
3     4          1      2         2    1
4     7          3      2         1    3
5     5          0      2         6    0
6     8          4      1         4    0
7     6          2      3         5    3

【讨论】：