【发布时间】:2019-01-10 22:29:46
【问题描述】:
我的目标是在我的数据集的几年内按大小汇总数据。我可以分别完成这两项任务(例如按年份汇总或按 bin 汇总),但在将两者结合起来时遇到语法问题。
以下是我如何按年份汇总数据:
size_summary = df_raw.groupby(['Year'])['Quantity'].describe()
下面是我如何创建我的垃圾箱
mult = 1
bins = [5*mult, 10*mult, 25*mult, 50*mult, 100*mult]
groups = df_raw.groupby(pd.cut(df_raw['Quantity'], bins))
当我尝试在下面将两者结合起来时,我收到一条错误消息。有谁知道如何结合它来达到我的目标?谢谢您的帮助。
groups.groupby(['Year'])['Quantity'].describe()
AttributeError: Cannot access callable attribute 'groupby' of 'DataFrameGroupBy' objects, try using the 'apply' method
编辑:根据要求添加示例数据,如下所示。
df_raw = pd.DataFrame(data={
'Year': [2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2012, 2013, 2013, 2013, 2013, 2013, 2013, 2013, 2013, 2013, 2013, 2013, 2013, 2013, 2013, 2014, 2014, 2014, 2014, 2014, 2014, 2014, 2014, 2014, 2014, 2014],
'Quantity': [2.0, 3.0, 78.8, 65.7, 70.0, 61.9, 83.9, 39.7, 44.1, 14.5, 35.3, 82.2, 13.9, 66.6, 65.8, 94.8, 50.8, 17.1, 9.9, 51.1, 62.9, 63.0, 13.5, 37.6, 1.5, 70.7, 23.3, 28.1, 21.9, 60.7, 1.1, 67.2, 0.4, 81.4, 86.7, 36.2, 45.2, 50.4, 43.3]
})
【问题讨论】:
-
请发布示例数据集和所需的输出。
-
按要求,请参阅编辑。