【发布时间】:2021-11-08 17:38:22
【问题描述】:
我有一个时间序列数据集,可以使用以下代码创建。
idx = pd.date_range("2018-01-01", periods=100, freq="H")
ts = pd.Series(idx)
dft = pd.DataFrame(ts,columns=["date"])
dft["data"] = ""
dft["data"][0:5]= "a"
dft["data"][5:15]= "b"
dft["data"][15:20]= "c"
dft["data"][20:30]= "d"
dft["data"][30:40]= "a"
dft["data"][40:70]= "c"
dft["data"][70:85]= "b"
dft["data"][85:len(dft)]= "c"
在数据列中,唯一值是a,b,c,d。这些值在不同的时间窗口中按顺序重复。 我想捕获该时间窗口的第一个和最后一个值。我该怎么做?
【问题讨论】:
-
我想你首先需要
pandas.groupby,然后按日期分组 -
@iamwhoiam : 提供输出 .. 其他用户会更容易看到您的需求
-
@codeholic24 如您所见,有一个公认的解决方案
标签: python pandas time-series