【问题标题】:How to correctly group columns?如何正确分组列?
【发布时间】:2019-08-02 13:45:11
【问题描述】:

我有一个包含这些列的数据框:

DF.head():
Email           Month    Year
abc@Mail.com      1      2018
abb@Mail.com      1      2018
abd@Mail.com      2      2019
     .   
     .
abbb@Mail.com     6      2019

我想做的是获取 2018 年和 2019 年每个月的电子邮件地址总数(知道我不需要过滤,因为我只有这两年)。

这是我所做的,但我想确保这是正确的:

 Stats = DF.groupby(['Year','Month'])['Email'].count()

有什么建议吗?

【问题讨论】:

    标签: python pandas dataframe group-by multiple-columns


    【解决方案1】:

    这取决于需要什么。

    如果需要排除Email列中不存在的缺失值或缺失值,你的解决方案是对的,使用GroupBy.count

    Stats = DF.groupby(['Year','Month'])['Email'].count()
    

    如果需要计算所有包含缺失值的组(如果存在),请使用GroupBy.size

    Stats = DF.groupby(['Year','Month']).size()
    

    【讨论】:

      猜你喜欢
      • 2012-06-18
      • 1970-01-01
      • 1970-01-01
      • 2020-10-25
      • 2020-12-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多