【发布时间】:2017-05-27 09:32:07
【问题描述】:
我有以下数据框:
userid | time
1 22.01.2001 13:00
1 22.01.2001 13:05
1 22.01.2001 13:07
2 22.01.2001 14:00
2 22.01.2001 14:04
2 22.01.2001 13:05
2 22.01.2001 13:06
3 22.01.2001 13:20
3 22.01.2001 13:22
4 22.01.2001 13:37
我想要获得的是每个用户的一个新列,它存储连续活动之间的平均时间差:
userid | avg_time_diff
1 3.5 #(5 + 2) / 2
2 2 #(4 + 1 + 1) / 3
3 2
4 0
要实现这一点,我是否需要循环遍历每个用户并一一计算平均时间差?或者,有没有更快的方法来达到同样的效果?
【问题讨论】:
标签: python pandas dataframe group-by