【发布时间】:2020-07-23 20:41:48
【问题描述】:
我有一个如下的熊猫数据框。我想根据每个订单对“NEW1”列执行累积总和。下面的代码部分工作,但它并没有忽略 Nan 的意思,我预计最后一行的 'cumsum' 的值为 8
import pandas as pd
import numpy as np
df = pd.DataFrame({'ORDER':["A", "A", "B", "B"], 'NEW1':[np.nan, 5, 8, np.nan]})
df['cumsum'] = df.groupby(['ORDER'])['NEW1'].cumsum()
df
ORDER NEW1 cumsum
0 A NaN NaN
1 A 5.0 5.0
2 B 8.0 8.0
3 B NaN NaN
我的预期输出:
ORDER NEW1 cumsum
0 A NaN NaN
1 A 5.0 5.0
2 B 8.0 8.0
3 B NaN 8.0
【问题讨论】:
-
如果设置
skipna=True会怎样?