【发布时间】:2020-11-07 14:55:08
【问题描述】:
这是一个示例数据集。
import pandas as pd
import numpy as np
df = pd.DataFrame({
'VipNo':np.repeat( range(3), 2 ),
'Quantity': np.random.randint(200,size=6),
'OrderDate': np.random.choice( pd.date_range('1/1/2020', periods=365, freq='D'), 6, replace=False)})
print(df)
所以我有几个步骤要做。我想创建一个名为 qtywithin1mon/totalqty 的新列。首先,我想对 VipNo 进行分组(每个数字代表一个人),因为一个人可能进行了多次购买。然后我想看看 orderdate 是否在某个范围内(比如说 2020/03/01 - 2020/03/31)。如果是这样,我想使用当天的相应数量除以该客户购买的总数量。我的数据集很大,因此客户可能在时间范围内订购了两次,在这种情况下,我希望将两个订单的总和除以总数量。我怎样才能实现这个目标?我真的不知道从哪里开始..
非常感谢!
【问题讨论】:
-
...当天的数量除以总数量此客户购买,这个总数是总总数还是给定范围内的总数范围?
-
这是总数
标签: python pandas datetime group-by