【发布时间】:2020-10-20 02:43:39
【问题描述】:
我有一个数据框,其中有一个时间戳列(最初是使用 pd.to_datetime 转换的字符串值),对其进行排序并设置为索引。我希望通过此索引过滤数据框,以删除未包含在给定时间段集中的所有行。
示例时间段将是(格式为 %m/%d/%Y %H:%M:%S.%f 如果重要):
10/05/2020 13:14:40.980 to 10/05/2020 21:50:52.323
10/06/2020 06:45:31.839 to 10/06/2020 17:05:11.382
10/06/2020 22:10:05.872 to 10/07/2020 07:03:52.872
etc....
我发现df.between_time(*pd.to_datetime(['10/05/2020 13:14:40.980', '10/06/2020 21:50:52.323']).time) 可用于选择单个时间段,但如何一次选择多个时间段?可以这样使用 between_time 吗?我需要制作一个参考字典来配对不同时间段的开始/结束时间吗?
此外,在执行此过滤步骤时计算从总数中排除的行数将有助于了解。
感谢您提供的任何帮助。
【问题讨论】: