【发布时间】:2018-12-05 19:29:26
【问题描述】:
我正在尝试创建一个新的Column,它基于单独的columns 中的值显示cumulative count。
所以对于下面的代码,我正在尝试基于Cause 和Answer Columns 创建两个新列。所以对于Column Answer 中的值,如果In 位于Column Cause 中,我想在新列中提供累积计数。
import pandas as pd
d = ({
'Cause' : ['In','','','In','','In','In'],
'Answer' : ['Yes','No','Maybe','No','Yes','No','Yes'],
})
df = pd.DataFrame(d)
输出:
Answer Cause
0 Yes In
1 No
2 Maybe
3 No In
4 Yes
5 No In
6 Yes In
预期输出:
Answer Cause Count_No Count_Yes
0 Yes In 1
1 No
2 Maybe
3 No In 1
4 Yes
5 No In 2
6 Yes In 2
我尝试了以下方法,但出现错误。
df['cumsum'] = df.groupby(['Answer'])['Cause'].cumsum()
【问题讨论】:
标签: python pandas group-by count cumsum