【发布时间】:2014-08-02 11:25:56
【问题描述】:
我使用 pandas 对数据集进行分组。当我用不同的函数聚合不同的列时,我得到了一个分层的列结构。
G1 = df.groupby('date').agg({'col1': [sum, np.mean], 'col2': 'sum', 'col3': np.mean})
结果:
col1 col2 col3
sum mean sum mean
date
2000-11-01 1701 1.384052 82336 54.222945
2000-11-02 11101 1.447894 761963 70.027260
2000-11-03 11285 1.479418 823355 77.984268
不幸的是,我在文档中找不到太多关于这种结果结构的信息。我在 pandas 文档中发现的唯一内容是分层多索引。
如何访问这些值?
目前我做:X['col1']['mean'] 访问整个Series
2000-11-01 1.384052
2000-11-02 1.447894
2000-11-03 1.479418
因此X['col1']['mean'][1] 得到值1.447894,但我想知道性能,因为此代码首先切片col1 (X['col1']) 导致视图/复制(不知道哪个在这种情况下)实际上包含 2 列,然后还有另一部分 mean-column。
有什么建议吗? 在哪里可以找到有关文档中分层列创建的更多信息?
【问题讨论】:
标签: python pandas indexing group-by hierarchical-data