【发布时间】:2015-07-03 11:29:09
【问题描述】:
我对 pandas 比较陌生,并试图找出计算此信息的最佳方法是什么,因此非常感谢任何帮助。基本上我有一个看起来像这样的数据框:
id activity_date
1 2015-01-01
1 2015-01-02
1 2015-01-03
2 2015-01-02
2 2015-01-05
3 2015-01-10
我想计算以下信息“每个帐户活跃了多少天?”,我知道我可以简单地计数来获取此信息,但我想应用以下限制,“如果有 n活动日期之间的天数,仅计算该间隔之前的天数”。
例如,如果 n = 5,则以下应返回活动天数为 4,而不是 6
id activity_date
1 2015-01-01
1 2015-01-02
1 2015-01-04
1 2015-01-06
1 2015-01-14
1 2015-01-15
【问题讨论】:
标签: python date datetime pandas time-series