【发布时间】:2020-07-23 02:57:33
【问题描述】:
我有一个像这样的数据框:
ID timestamp field2
ABC 456788 event1
ABC 456688 event2
DEF 856788 event1
ABC 96788 event1
我希望得到这个结果,按周分组:
ID timestamp field2 count
ABC 29/03/2020 event1 2
ABC 22/03/2020 event2 1
DEF 29/03/2020 event1 1
所以我设法使用此代码对时间戳进行分组并将其转换为日期:
grouper = dftest.groupby(['ID', 'field2', pd.Grouper(key='timestamp', freq='W')])
但是当我这样做以查看结果时:
grouper.count().reset_index()[(grouper.count().reset_index().ID == "ABC")]
我不明白计数。此外,它只留下其中一行具有(相同的字段2,由同一周内的同一用户)。
这就像分组但没有计数(因为在这种情况下,用户 ABC 在同一周 (29/03/2020) 有两个 event1)。我得到的结果如下:
ID timestamp field2
ABC 29/03/2020 event1
ABC 22/03/2020 event2
我已经在这里阅读了很多帖子和文档,但我无法弄清楚。我可以尝试解决什么问题?
【问题讨论】:
标签: python-3.x pandas