【发布时间】:2020-12-01 04:07:24
【问题描述】:
我有一个包含两列的数据熊猫数据框。它有一个名为“DateAndTime”的列(datetime64[ns]) 和一个名为“完成”(布尔)的列。大约有 5000 多行,所有行都有不同的日期和时间,并且“已完成”列为 True。
我要做的是将数据分组为上午 7 点至晚上 7 点和晚上 7 点至上午 7 点的“班次”,并总结在 12 小时期间发生了多少真。
df.head()
DateAndTime Finished
109 2020-07-28 14:36:07.983 True
110 2020-07-28 14:36:34.547 True
111 2020-07-28 14:39:38.187 True
112 2020-07-28 14:41:10.547 True
113 2020-07-28 14:41:32.250 True
df.describe()
DateAndTime Finished
count 5915 5915
unique 5915 2
top 2020-07-29 07:34:25.360000 True
freq 1 5914
first 2020-07-28 14:36:07.983000 NaN
last 2020-08-05 04:57:10.657000 NaN
【问题讨论】:
-
查看类似:stackoverflow.com/questions/63289803/… 您可以使用
offset重新采样。 -
带偏移量的重采样正是我想要的。谢谢。
-
最后我使用了这个
df.resample('12h', base=7).count(),因为当我使用loffset时它没有正确分组