zhoudayang

  对于pandas中的Dataframe,如果需要按照列A进行分组,将同一组的列B求和,可以通过下述操作完成:

df = df.groupby(by=[\'column_A\'])[\'column_B\'].sum()

  生成的数据类型是Series,如果进一步需要将其转换为dataframe,可以调用Series中的to_frame()方法.

df = df.to_frame()
#index column_A 
#column_B ->column_B values

  可以取出上述dataframe中的index,生成新的一列,并删除原dataframe中的index.

df[\'column_A\'] =df.index
df =df.reset_index(drop= True)

 

分类:

技术点:

相关文章: