【发布时间】:2016-11-27 20:25:28
【问题描述】:
这是虚假数据:
df = pd.DataFrame({'email': ['u1','u1','u1','u2','u2','u2'],
'timestamp': [3, 1, 5, 11, 15, 9]})
我打算检索的是每组电子邮件中的时间差异。因此,在每组中按时间戳排序后,数据应该是:
u1 5
u1 3
u1 1
u2 15
u2 11
u2 9
结果应该是:
u1 2 # 5-3
u1 2 # 3-1
u2 4 # 15-11
u2 2 # 11-9
谁能告诉我下一步该怎么做?非常感谢。
【问题讨论】: