【发布时间】:2020-06-25 23:45:48
【问题描述】:
我有一个时间序列数据,我想通过近似缺失数据点和标准化采样率来清理数据。
鉴于可能存在一些不均匀间隔的数据点这一事实,我想定义一个函数来获取时间序列和间隔 X(例如,30 分钟或任何其他间隔)作为输入,并给出点为的时间序列在 X 间隔内间隔作为输出。
如下所示,周期是每 10 分钟一次,但缺少一些数据点。所以算法应该检测丢失的时间并删除它们并创建适当的时间并为它们生成值。然后根据定义的函数,改变和标准化采样率。 为了近似缺失数据并对其进行清理,平均或线性插值都可以。
这是原始数据的一部分:
import pandas as pd
import numpy as np
df = pd.DataFrame({
"Time": ["10:09:00","10:19:00","10:29:00","10:43:00","10:59:00 ", "11:09:00"],
"Value": ["378","378","379","377","376", "377"],
})
df
【问题讨论】:
-
您在第一个时间戳中忘记了一个数字,并且您还有一些尾随空格,您需要先删除这些空格。
标签: python pandas time-series