【发布时间】:2018-07-31 21:39:16
【问题描述】:
我正在尝试拟合 ARIMA 模型。我有 3 个月的数据,每分钟显示count(float)。我应该为arima.fit() 传递哪个命令?
我需要预测每一分钟。
【问题讨论】:
-
如果您对统计数据一无所知,您应该尝试在交叉验证上询问。
我正在尝试拟合 ARIMA 模型。我有 3 个月的数据,每分钟显示count(float)。我应该为arima.fit() 传递哪个命令?
我需要预测每一分钟。
【问题讨论】:
基本的 ARIMA(p,d,q) 模型不适用于您的数据。
您的数据违反了 ARIMA 的假设,其中之一是参数必须随时间保持一致。
我看到了 5 个峰值的集群,所以我假设您有 5 个忙碌的工作日和安静的周末。 Basic ARIMA 不会知道工作日和周末之间的区别,因此它可能不会为您提供有用的结果。
有 SARIMA(季节性自回归综合移动平均线)之类的东西。如果您处理的是每日数据点,这将很有用,但也不适用于分钟数据。
我建议您尝试过滤数据,以便将晚上和周末排除在外。然后,您可能正在处理具有一致参数的数据集。如果您使用的是 python,您可以尝试在过滤的时间序列数据上使用金字塔的 auto_arima() 函数,让它尝试自动找到最佳参数 p、d、q。
它还进行了许多您可能希望针对此类分析进行的统计测试。我实际上并不总是同意 auto_arima 的参数选择,但这是一个开始。
model = pyramid.arima.auto_arima(s)
print(model.summary())
http://pyramid-arima.readthedocs.io/en/latest/_submodules/arima.html
【讨论】:
1) 你的数据对 box -Jenkins 模型(ARIMA) 是否有用?
2) 我最终看到更高的平均值。数据有明显的季节性。 ARIMA 将失败。请尝试基于季节性的模型 - SARIMA 正如 try 所建议的那样,Prophet 是 Facebook 的另一个漂亮的季节性算法。 - (R 实现)
https://machinelearningstories.blogspot.com/2017/05/facebooks-phophet-model-for-forecasting.html
3) 不仅仅依赖 ARIMA。尝试其他时间序列算法,如 STL、BTS、TBATS。 (结构时间序列)和混合等。如果您需要 R 中的一些包信息,请告诉我?
【讨论】: