【发布时间】:2018-06-10 12:41:38
【问题描述】:
我正在尝试创建一个使用 2 列进行累积总和的列,请参阅我正在尝试做的示例:@Faith Akici
index lodgement_year words sum cum_sum
0 2000 the 14 14
1 2000 australia 10 10
2 2000 word 12 12
3 2000 brand 8 8
4 2000 fresh 5 5
5 2001 the 8 22
6 2001 australia 3 13
7 2001 banana 1 1
8 2001 brand 7 15
9 2001 fresh 1 6
我使用了下面的代码,但是我的电脑一直在崩溃,我不确定是代码还是电脑。任何帮助将不胜感激:
df_2['cumsum']= df_2.groupby('lodgement_year')['words'].transform(pd.Series.cumsum)
更新;我也使用了下面的代码,它工作并说退出代码 0。但是有一些警告。
df_2['cum_sum'] =df_2.groupby(['words'])['count'].cumsum()
【问题讨论】:
-
是
'lodgement_year'还是'lodgement_date'? -
您好,它的 lodgemement_year(对不起)。 @Piinthesky 我只是想参考前一个问题的上下文。但是很高兴删除。
-
需要'lodgement_year'吗?根据样本输出,似乎累积总和只是基于“单词”?
-
你能显示预期的输出数据帧吗?
-
嗨,对不起......上面的 cum_sum 是我试图创建的列。并且下面的代码有效,但是它在顶部打印了一些警告。 df_2['cum_sum'] =df_2.groupby(['words'])['count'].cumsum()
标签: python pandas cumulative-frequency