【发布时间】:2023-03-15 12:35:01
【问题描述】:
我正在尝试分析几个热力建筑模拟的结果。每次模拟都会为几个变量和所分析建筑物的每个房间生成每小时数据。可以针对不同的场景重复模拟,并且这些场景中的每一个都会为每个房间和每个变量生成不同的每小时数据集。
目前我为每个场景创建了一个单独的数据框(带有变量和房间的多索引)。我的目标是能够比较不同维度的不同场景:同一个房间、房间平均值、时间平均值等。
据我目前了解的有两种选择:
- 创建一个数据框字典,其中键代表场景
- 在表示场景的同一数据框中的多索引中添加额外的级别(第 3 级)
在性能和灵活性方面,以上哪一项会给我带来最好的结果。
典型问题可能是:
- 在这种情况下,平均室温低于阈值持续数小时
- 在哪种情况下最高室温低于阈值
- 每个房间 7 月的平均温度是多少
如您所见,我需要在不同的层级执行操作:在一个场景内以及不同场景之间的比较。
将所有内容保存在同一个数据框中还是分发数据更好?
【问题讨论】:
标签: python pandas hierarchy multi-index