【发布时间】:2021-10-02 00:41:08
【问题描述】:
我对熊猫很陌生。
基本上,我在 10 个 dfs 中有 10 个不同公司的不同类型的数据。例如总资产、资产管理规模等
对于每种类型的数据,可能有高或低的重要性:H 或 L。
对于每种类型的数据,可能有 3 个类别:Cat1、Cat2、Cat3。
对于 H 重要性,我需要按 3 个类别分析数据。 L 重要性也一样。
我正在考虑在合并 10 个 dfs 后为每列数据添加一个多索引。这可能吗?
当前状态
**df_1**
|Total Assets|
Firm 1| 100 |
Firm 2| 200 |
Firm 3| 300 |
**df_2**
|AUMS |
Firm 1| 300 |
Firm 2| 3400 |
Firm 3| 800 |
Firm 4| 800 |
and so on until df_10. Also the firms for all the df could differ.
期望的输出
**Merged_df**
Importance| L | H |
Category | Cat1 | Cat2 |
|Total Assets| AUMs |
Firm 1 | 100 | 300 |
Firm 2 | 200 | 3400 |
Firm 3 | 300 | 800 |
Firm 4 | NaN | 800 |
接下来,我需要按“重要性”和“类别”进行分组。欢迎使用除多索引之外的任何其他解决方案。谢谢!
【问题讨论】:
标签: python pandas pandas-groupby multi-index