【发布时间】:2021-09-03 03:16:46
【问题描述】:
这是我的数据框的一个示例:
df.head(10)
, customer_id order_id, product, purchased_at
0, 2, 2000, B, 2021-05-01 21:51:13
1, 1, 1996, A, 2021-04-06 13:02:37
2, 1, 2540, B, 2021-05-06 16:02:37
3, 4, 4514, C, 2021-04-05 10:55:18
4, 4, 4560, D, 2021-04-10 11:56:18
5, 5, 6899, Y, 2021-04-07 09:53:45
6, 2, 7891, A, 2021-04-07 09:59:21
7, 2, 8120, B, 2021-06-04 09:19:41
8, 3, 9423, Z, 2021-03-28 15:34:29
9, 3, 9423, X, 2021-03-28 15:34:29
... ... ....
我想为每个客户获取哪个产品导致另一个产品,然后计算对之间的间隔,例如: 客户 1 在他的第一个订单中购买了产品 A,然后在他的第二个订单中购买了产品 B。所以产品 A 导致产品 B (A-> B) 是一对。然后计算平均间隔。
我需要您的帮助来找到最佳方法,以实现我已经解释过的内容,以及显示输出的最佳方法,以便计算这些对之间的平均间隔以及一个库以将其可视化。提前致谢。
【问题讨论】:
标签: python pandas numpy data-science