使用 Pandas 按两列和按周分组答案

【问题标题】：Grouping by two columns and by week with Pandas使用 Pandas 按两列和按周分组
【发布时间】：2020-07-23 02:57:33
【问题描述】：

我有一个像这样的数据框：

ID timestamp field2
ABC 456788   event1
ABC 456688   event2
DEF 856788   event1
ABC 96788    event1

我希望得到这个结果，按周分组：

ID timestamp      field2 count
ABC 29/03/2020    event1   2
ABC 22/03/2020    event2   1
DEF 29/03/2020    event1   1

所以我设法使用此代码对时间戳进行分组并将其转换为日期：

grouper = dftest.groupby(['ID', 'field2', pd.Grouper(key='timestamp', freq='W')])

但是当我这样做以查看结果时：

grouper.count().reset_index()[(grouper.count().reset_index().ID == "ABC")]

我不明白计数。此外，它只留下其中一行具有（相同的字段2，由同一周内的同一用户）。

这就像分组但没有计数（因为在这种情况下，用户 ABC 在同一周 (29/03/2020) 有两个 event1）。我得到的结果如下：

    ID timestamp      field2
    ABC 29/03/2020    event1
    ABC 22/03/2020    event2

我已经在这里阅读了很多帖子和文档，但我无法弄清楚。我可以尝试解决什么问题？

【问题讨论】：

【解决方案1】：

如果需要使用count 函数，请在groupby 之后指定列名，然后为新列使用Series.reset_index 和name 参数：

df = (dftest.groupby(['ID', 'field2', pd.Grouper(key='timestamp', freq='W')])['ID']
            .count()
            .reset_index(name='count'))

【讨论】：