shilo930
import pandas as pd
data1_group=data1[\'count_num\'].groupby(data1[\'i_week\'])
i2=data1_group.mean()
print(pd.DataFrame(i2))
print(data1_group.size())
print(data1_group.agg({\'mean\':\'mean\',\'sum\':\'sum\'}))

  分组统计:将数据集data1的count_num按照i_week的数值分组计算均值

  比如count_num是每天的销售额; i_week是今天是星期几的分类变量,那么这个计算的意思就是:分别求周一周二周三周四周五周六周日的平均销售额

  

  data1_group  →将data1按照i_week分组后的数据

  i2  →周一周二周三周四周五周六周日的平均销售额

  data1_group.size()  →周一周二周三周四周五周六周日各有几天

  data1_group.agg({\'MEAN\':\'mean\',\'SUM\':\'sum\'})  →周一周二周三周四周五周六周日的平均销售额和总销售额

 

后续补充:简单的分组计数

df1_gp=df1.groupby(\'nyr\')  #将df1按照nyr字段分组
df1_gp_count=df1_gp.count()  #计算每个字段的分组计数结果,并把结果赋给df1_gp_count

 

分类:

技术点:

相关文章: