ARIMA  模型 差分自回归移动平均模型

Autoregressive Integrated Moving Average Model

时间序列ARIMA模型

其分为 差分 自回归 移动平均 三部分(接下来也是按这三部分介绍ARIMA)

原理的意思是

时间序列ARIMA模型

第一个图是原数据图,第二个图是做了一阶差分的数据图 ,第三个图是做了二阶差分的图

可以看到,第二第三个图是围绕某一值上下浮动变化的,也就是非平稳(第一个图)过渡到平稳(二三个图)

滞后值其实也就是p,q,其对应是AR自回归方程需要做几阶(和前第几天的数据有关系)和 MR移动平均方程需要做几阶(调整前第几天导致的误差)

 

接下来先讲一下什么是平稳性 ,如何让一个非平稳的数据中得到平稳的数据

时间序列ARIMA模型

其实也就是数据能按照一定的分布,上下浮动地变化,并且分布不会因为时间而改变(也就是同一段时间内认为分布一样)

因此平稳性就是对序列的均值和方差有不发生明显变化的要求

时间序列ARIMA模型

平稳也分严平稳和弱平稳

而我们ARIMA模型其实研究更多的是弱平稳下的数据,也就是认为,未来的数据是会和历史的数据有一定关联的

而我们如何从一个非平稳的数据中得到我们想要的平稳的数据呢

就是需要用到我们的差分法(ARIMA模型第一部分)

时间序列ARIMA模型

进行差分后可以看到得到的数据是更平稳的 ,当然此时的数据是原数据在时间序列上的变化值

 

得到一个平稳的数据后,就是需要AR自回归模型(ARIMA模型第二部分)和MA 移动平均模型(ARIMA模型第三部分)

时间序列ARIMA模型

AR自回归模型的条件是平稳性,描述的是用历史数据来进行预测

这里的p阶自回归模型定义中,p其实就是综合考虑当前yt 和 前i天数据 yt-i 的数据之间的关系

也就是 前i天数据 yt-i 对 当前yt出现的数据的影响各有多大呢——这个就是需要求解的自相关系数ri

p值,q值也一样,都是需要我们预先指定,在训练过程中得到合适的自相关系数

而AR自回归模型也有其限制

时间序列ARIMA模型

自相关系数太小了,其实也可以认为数据间都已经是没有一个明显的相关性,也就不存在能用历史数据来进行预测任务

之后就是MA移动平均模型

时间序列ARIMA模型

MA移动平均模型更关注的是在AR中的误差项

这里的q值需要我们指定,而sita 是在训练中不断调整的值

其意思是对前第几天的数据误差的综合考虑,减少前第几天的数据可能波动(减少部分数据的浮动范围)

因此就有ARMA模型

时间序列ARIMA模型

ARMA模型的数据在预处理的时候进行差分处理的话 就是ARIMA模型

在ARIMA模型中p q是需要我们去指定,ri 和 sita i 是在训练过程中不断优化的参数

时间序列ARIMA模型

 

那我们如何选择合适的p q 值呢

就需要ACF 和 PACF提供依据了

ACF:

时间序列ARIMA模型

ACF研究的是 yt 和 yt-k 的关系 也就是当前时间数据值和前面某一天的数据的关系

而PACF 是在ACF 的情况下更加纯净地去考虑 yt 和 yt-k 的关系

时间序列ARIMA模型

就是因为在ACF 中yt yt-k中间 的数据会yt的数据是有影响的,也就是并不完全是yt 和 yt-k 两个数据间的关系

因此才有了PACF ,是更严格地去考虑yt yt-k的关系

 

知道了ACF PACF ,也就能去求p q值(主要看什么时候截尾)

 

时间序列ARIMA模型

那截尾在图像上表达什么意思呢

时间序列ARIMA模型

在图像上,截尾就是在某一个值之后就是落在95%的置信区间上,那么截尾的位置就是我们p q取得位置

像上面的数据,如果紫色区域就是置信区间,那么p q的值其实可以取0或1 看看效果

而这里AR(p)看PACF :AR 希望更清楚考虑的是yt 和 yt-k 两者关系

MA(q)看ACF:这里可以综合因素去考虑和调整误差项

 

到此时我们就可以得出ARIMA模型的建模流程了:

时间序列ARIMA模型

 

之后我们更详细的来讲一下怎么通过选择参数得到更优的ARIMA,和评估ARIMA模型的效果

选择pq参数,我们其实可以通过AIC 和 BIC 结合热度图的方式,得到合适和值

时间序列ARIMA模型

这里的更简单的模型是基于AR MA 来说的,也就是多考虑有主要效果的数据

AIC和BIC 很明显是希望越小越好的(L似然函数——极大似然函数,和实际越像越好;k模型参数个数,多集中在影响更大的数据,因此k参数较小更好 (82原则))

而BIC比AIC更好的一点是BIC还会考虑样本数量

时间序列ARIMA模型

我们选择BIC最小的那一组pq参数组合 也就是 p=1 q=1

时间序列ARIMA模型

之后也可以看下ARIMA模型情况,这里也可以用一个QQ图来判断ARIMA模型效果

时间序列ARIMA模型

相关文章: