【发布时间】:2017-08-16 06:46:56
【问题描述】:
我有一个数据集,其中包含一些数值观察结果,其中包含开始和结束时间。我正在尝试为每个观察分配一个 bin,每个 bin 为 5 分钟,如果事务在该时间间隔内开始,则应分配该 bin。 (我探索了 pandas 中的重采样选项,但我找不到保留观察的独特属性的方法,例如数量)
data
id start end amt count
1004 2017-07-01 08:02:30 2017-07-01 10:02:30 250 1
1004 2017-07-01 08:09:30 2017-07-01 09:03:35 250 1
1006 2017-07-01 09:54:50 2017-07-01 10:26:31 50 1
timebins
0 00:00:00
1 00:05:00
2 00:10:00
期望的输出是,
id start end amt count bin
1004 2017-07-01 08:02:30 2017-07-01 10:02:30 250 1 08:00
【问题讨论】: