【问题标题】:How to split a DataFrame into multiple DataFrames based off part of a MultiIndex?如何根据 MultiIndex 的一部分将 DataFrame 拆分为多个 DataFrame?
【发布时间】:2020-03-02 09:08:10
【问题描述】:

对于一个项目,我正在使用 BeautifulSoup 为我的大学抓取一些表格调度数据,然后使用 pandas.read_html() 将其读入 DataFrame。但是,数据位于一个大表中,该表使用两个标题在视觉上分成多个表:一个大学标题(即“工程学院”),然后是每一列的标题(即“课程”、“开始”)。

例如:


工程学院


课程 |开始 |结束 | ...


Pandas 正确地将标题解析为 MultiIndex,其中每个索引元组的第一部分是学院,第二部分是列标题。但是,我想要多个具有单列索引的 DataFrame,由大学分隔。我该怎么做?

【问题讨论】:

    标签: python pandas dataframe web-scraping


    【解决方案1】:

    如果我理解正确,它是大学名称的多级索引,后跟列,您想按大学名称拆分。

    Assuming df is your multiindex column dataframe,
    di = {}
    for i in df.columns.levels[0]:
        di[i] = df[i]
    

    这将创建一个包含大学键值对和相应数据框的字典

    【讨论】:

      猜你喜欢
      • 2019-04-05
      • 2018-03-10
      • 2020-12-29
      • 2015-05-29
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-07-10
      • 2016-11-17
      相关资源
      最近更新 更多