基础分析完成后,可能你马上想知道每个月的销售额是多少呢?接下来按照“时间”维度,以“月份”为单位,分析店铺的月份销售数据。分析“月份”,可能会关联到“payment_date”的数据。
大家知道,在Python基础的学习中,变量的数据类型非常重要,执行某个函数时都会和数据类型打交道。所以首先,我们先确定一下“payment_date”数据列的数据类型,代码如下:
join_data.dtypes
点击"运行",执行效果如下图所示。
可以发现,使用 dtypes,可以将每个数据列的数据类型都显示出来。这次我们要处理的“payment_date”是 object 类型,需要转换成datetime类型。
代码如下:
join_data["payment_date"] = pd.to_datetime(join_data["payment_date"])
join_data["payment_month"] = join_data["payment_date"].dt.strftime("%Y%m")
join_data[["payment_date","payment_month"]].head()
解释一下代码:
第1行:使用 to_datetime 函数,将“payment_date”的 object 数据类型转换成 datetime 数据类型。
第2行:类型转换后“payment_date”数据列,使用 dt.strftime("%Y%m"),创建一个新的数据列“payment_month”
第3行:使用head()函数,将数据列“payment_date”和数据列“payment_month”的前5行数据显示出来。
点击"运行",执行效果如下图所示。
接下来,我们以“payment_month”为单位,计算店铺各月的销量。
代码如下:
join_data.groupby("payment_month").sum()["price"]
解释一下代码:
使用groupby 函数,以“payment_month”分组,然后使用sum()函数,累计“price”的值。
点击"运行",执行效果如下图所示。
从结果可知,2019年7月份的销量最高,5月份的销量最低。每个月的销售额在千万左右,没有太大变化的话,预期一年的销售额可以过亿。
接下来,我们再来分析,每个月各个商品的具体销量是多少呢?
此处为语雀文档,点击链接查看:https://www.yuque.com/codeclub/yvmeco/friz9v