【发布时间】:2019-12-22 19:59:54
【问题描述】:
我正在处理一个数据集,其中包含有关在某些时间范围内发生的现象的信息。我得到了事件的开始和结束时间及其严重性,以及一些其他信息。我想通过在设定的时间段内扩展行并将其余信息保留为 NaN 来在更大的时间段内扩展这些帧。
数据集示例:
date_end severity category
date_start
2018-01-04 07:00:00 2018-01-04 10:00:00 12 1
2018-01-04 12:00:00 2018-01-04 13:00:00 44 2
我想要的是:
severity category
date_start
2018-01-04 07:00:00 12 1
2018-01-04 08:00:00 12 1
2018-01-04 09:00:00 12 1
2018-01-04 10:00:00 12 1
2018-01-04 11:00:00 nan nan
2018-01-04 12:00:00 44 2
2018-01-04 13:00:00 44 2
2018-01-04 14:00:00 nan nan
2018-01-04 15:00:00 nan nan
实现这种结果的有效方法是什么?
【问题讨论】:
-
你是如何确定 date_start 范围的结束的?
-
这将是任意的,可以作为:
datetime.datetime.now() -
第一行的 end_date 是否应该是 10:00 而不是 7:00 每个预期输出?第二行的 date_start 应该是 2018-01-04 而不是 2018-01-05?
-
是的,很好,我在格式化方面犯了一个错误
-
第二个 date_start 是
2018-01-04 12:00:00而不是2018-01-05 12:00:00
标签: python pandas date datetime