【发布时间】:2017-06-08 02:47:38
【问题描述】:
我现在花了几个小时尝试在 pandas 数据框上进行“按总和的累积分组”。我查看了所有 stackoverflow 的答案,令人惊讶的是没有一个可以解决我的(非常基本的)问题:
我有一个数据框:
df1
Out[8]:
Name Date Amount
0 Jack 2016-01-31 10
1 Jack 2016-02-29 5
2 Jack 2016-02-29 8
3 Jill 2016-01-31 10
4 Jill 2016-02-29 5
我正在尝试
- 按 ['Name','Date'] 和 分组
- cumsum '金额'。
- 就是这样。
所以想要的输出是:
df1
Out[10]:
Name Date Cumsum
0 Jack 2016-01-31 10
1 Jack 2016-02-29 23
2 Jill 2016-01-31 10
3 Jill 2016-02-29 15
编辑:我正在简化问题。使用当前的答案,我仍然无法获得正确的“正在运行”的 cumsum。仔细看,我想看累计和“10,23,10,15”。换句话说,我想在每个连续的日期查看一个人的总累计和。注意:如果同一个人在同一日期有两个条目,我想将它们相加,然后将它们添加到正在运行的 cumsum 中,然后才打印总和。
【问题讨论】: