如何正确分组列？答案

【问题标题】：How to correctly group columns?如何正确分组列？
【发布时间】：2019-08-02 13:45:11
【问题描述】：

我有一个包含这些列的数据框：

DF.head():
Email           Month    Year
abc@Mail.com      1      2018
abb@Mail.com      1      2018
abd@Mail.com      2      2019
     .   
     .
abbb@Mail.com     6      2019

我想做的是获取 2018 年和 2019 年每个月的电子邮件地址总数（知道我不需要过滤，因为我只有这两年）。

这是我所做的，但我想确保这是正确的：

 Stats = DF.groupby(['Year','Month'])['Email'].count()

有什么建议吗？

【问题讨论】：

标签： python pandas dataframe group-by multiple-columns

【解决方案1】：

这取决于需要什么。

如果需要排除Email列中不存在的缺失值或缺失值，你的解决方案是对的，使用GroupBy.count：

Stats = DF.groupby(['Year','Month'])['Email'].count()

如果需要计算所有包含缺失值的组（如果存在），请使用GroupBy.size：

Stats = DF.groupby(['Year','Month']).size()

【讨论】：