【发布时间】:2019-02-07 14:04:50
【问题描述】:
我在数据框中有以下数据:
Customer_ID| Customer_status| store_ID| date_of_transaction
12352423| active | 65|2018/10/1
12352425| inactive | 70|2018/10/1
12352425| inactive | 65|2018/10/1
12352426| active | 75|2018/10/1
目标:查看每家商店的非活跃客户与活跃客户的分布(或平均值)。这是为了确定是否有一些商店有更多的非活跃客户。
我使用以下代码创建了一个额外的列,其中包含每个商店的计数:
df_new['Counts'] =df_customer.store_id.groupby(df_customer.store_id).transform('count')
所以现在我有一个额外的列,其中包含每个唯一商店 ID 的计数。 EX :) 每个 store id = 65 的条目,counts 列都会显示 32,因为 store id 65 在整个数据集中出现了 32 次。
我对如何绘制此图感到困惑,因此我可以可视化每个唯一商店的不活动情况和客户状态。
谢谢!
【问题讨论】:
标签: python matplotlib seaborn