【发布时间】:2020-11-11 18:22:58
【问题描述】:
details = {
'order_number' : ['#1', '#2', '#3', '#4','#4'],
'disc_code' : ['no_discount', 'superman', 'hero', 'numero_uno','numero_uno'],
}
df = pd.DataFrame(details)
len(df) --> 6408
每一行都归属于一个产品,而不是一个交易。
如果我将每一行分组到每个订单名称,则有 3560 行。
len(df.groupby('order_number')) --> 3560
我想计算总共使用了多少折扣代码。 (如果没有使用折扣码,则值为'no_discount')
在 SQL 中,语法大概是这样的:
SELECT COUNT(*)
FROM transactions
GROUP BY order_number
WHERE discount_code != 'no_discount'
【问题讨论】:
-
groupby.nunique?
标签: python pandas pandas-groupby