【发布时间】:2022-01-23 07:55:14
【问题描述】:
我有一个包含许多列的 Pandas 数据框。其中两个是时间戳(start 和 end)。
start end value string
2021-12-01 14:00:00 2021-12-01 14:35:00 1 a
2021-12-01 17:00:00 2021-12-01 17:30:00 2 b
2021-12-01 14:00:00 2021-12-01 16:00:00 3 c
我需要将时间戳标记(下面的 time 列)标准化为 5 到 5 分钟,重复属于同一时间间隔的其他列 value 和 string 的值,如下所示:
time start end value string
2021-12-01 14:00:00 2021-12-01 14:00:00 2021-12-01 14:35:00 1 a
2021-12-01 14:05:00 2021-12-01 14:00:00 2021-12-01 14:35:00 1 a
2021-12-01 14:10:00 2021-12-01 14:00:00 2021-12-01 14:35:00 1 a
2021-12-01 14:15:00 2021-12-01 14:00:00 2021-12-01 14:35:00 1 a
2021-12-01 14:20:00 2021-12-01 14:00:00 2021-12-01 14:35:00 1 a
2021-12-01 14:25:00 2021-12-01 14:00:00 2021-12-01 14:35:00 1 a
2021-12-01 14:30:00 2021-12-01 14:00:00 2021-12-01 14:35:00 1 a
2021-12-01 17:00:00 2021-12-01 17:00:00 2021-12-01 17:30:00 2 b
2021-12-01 17:05:00 2021-12-01 17:00:00 2021-12-01 17:30:00 2 b
....
时间间隔上有很多交叉点,所以我无法使用df.resample 和DatetimeIndex。
【问题讨论】:
标签: python pandas datetime rows repeat