【发布时间】:2020-03-21 03:12:45
【问题描述】:
我有一个 DataFrame,其中包含有关某些项目的信息,例如状态、受让人、优先级等...我有一堆这样的 DataFrame,每个 DataFrame 代表一年中不同周的这些项目。
我想计算每个状态在每个 DataFrame 中出现的次数。我可以使用df.groupby("status").size().to_frame() 执行此操作,但这会在单独的 DataFrame 中一次获取一帧的信息。
如何将这些 DataFrame 组合在一起以获得一个大 DataFrame? (每一行看起来像:日期,状态,计数)此外,如果状态出现在其中一个子集中,但不在其他子集中,我需要将该状态添加到计数为 0 的所有其他子集中。这是可能的?我无法找到另一个答案或一组答案来解释这一点。
【问题讨论】:
-
考虑添加数据框样本和预期输出。
-
您可能想查看pandas merge 来了解您问题的第一部分