【问题标题】:Impute time series using similar time series使用相似时间序列估算时间序列
【发布时间】:2021-02-14 11:01:20
【问题描述】:

我有一个问题,我有很多关于 1 年恒温器记录的数据,每个小时它都会给我那个家庭的平均温度。但是很多数据是不可用的,因为他们只是在年中安装了温控器,或者他们把温控器放了一个星期或者......但是很多这个温控器的数据真的很相似。我想要做的是使用相似的时间序列来估算丢失的数据。

假设 A 房屋仅在 7 月开始,但从那里它们与 B 房屋非常相似,然后我想使用 B 房屋的信息来预测 A 房屋 7 月之前的数据。

我正在考虑训练一个可以为我做到这一点的循环神经网络,但我不确定有什么可以做到这一点,当我搜索论文时,他们几乎只在多年的数据集上工作并估算数据采用往年数据。我没有这些数据,所以这不是一个选择。

有没有人知道如何解决这个问题或我可以使用解决类似问题的参考?

【问题讨论】:

  • 你能分享一些数据吗?

标签: machine-learning time-series missing-data forecasting imputation


【解决方案1】:

据我了解,您希望使用横截面数据而不是时间序列信息来估算数据。

实际上有很多插补包可以在 R 中为您执行此操作。(如果您使用的是 R)

您需要等间距的数据。所以每小时 1 个值,如果它不存在,那么它需要是 NA。因此,理想情况下,您将拥有多个等长的时间序列。

然后你根据时间戳/小时合并这些时间序列。

之后,您可以应用插补包,例如mice, missForest, imputeR 基本上只有一行代码。这些包将使用不同时间序列之间的相关性来估计这些序列中的缺失值。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2020-02-09
    • 2019-08-29
    • 1970-01-01
    • 2021-04-26
    • 2017-04-20
    • 2011-04-02
    • 2011-07-02
    • 2015-10-24
    相关资源
    最近更新 更多