1. 平稳性

  1. 指的是时间序列样本及拟合曲线在未来时间点上按照现有的某种趋势延续下去。均值与方差无明显的变化。
  2. 平稳性分为严平稳性(不太可能出现)和弱平稳性(期望与相关系数不变
  3. 时间序列模型主要用来预测,若平稳性都无法保证,何来预测?

2. 差分

  1. 举例来说:一阶差分就是XtX_tXt1X_{t-1}时刻的差值。二阶差分就是在一阶差分完成后,在进行一次一阶差分的操作。
  2. 差分法可以降低时间序列数据的波动。

3. AR(自回归模型)

  1. 回归模型研究的是X与Y的相关关系,AR模型研究的是X自己与自己的关系,基于时间的X的历史值与当前值的关系,用历史值预测未来值。
  2. 自回归模型要求数据满足平稳性要求
  3. p阶(当期与前p个时期)自回归模型公式:yt=μ+i=1pγiyti+ϵty_t = \mu + \sum_{i=1}^p\gamma_iy_{t-i} + \epsilon_t
  4. 公式中μ\mu为常数项,ϵ\epsilon为误差项,γi\gamma_i为自相关系数(一般以0.5为判断标准),\sum表示前p期的影响都被考虑进来,而不只是第p期的影响。

4. MA(移动平均模型)

  1. 关注的是AR模型中ϵi\epsilon_i的累加。目的是为了消除预测中的随机波动。
  2. q阶移动平均模型:yt=μ+i=1qθiϵti+ϵty_t = \mu+\sum_{i=1}^q\theta_i\epsilon_{t-i}+\epsilon_t

5. ARIMA

  1. ARMA指的是将AR和MA都考虑进来:yt=μ+i=1pγiyti+i=1qθiϵti+ϵty_t=\mu+\sum_{i=1}^p\gamma_iy_{t-i}+\sum_{i=1}^q\theta_i\epsilon_{t-i}+\epsilon_t
  2. I指的是差分(一般做1阶差分即可)。

6. pdq三参数的选择

  1. d是指定几阶差分的参数。
  2. 通过ACF自相关函数与PACF偏自相关函数确定p和q。
  3. ACF:一个变量在不同时间上的相关性的度量。
  4. PACF:ACF度量XtX_tXtkX_{t-k}之间的相关性时还考虑进两者间时间点的数据影响;PACF只考虑XtX_tXtkX_{t-k}之间的相关性,剔除了其余影响。
  5. 还可以参考BIC贝叶斯信息准则与AIC赤池信息准则来选定pq。BIC与AIC越小,pq越佳。

【算法原理】时间序列模型ARIMA
【算法原理】时间序列模型ARIMA

7. ARIMA模型的残差检验

  1. 看模型残差是否服从均值为0,方差为常数的正态分布。
  2. QQ图看残差点是否能排成一条直线。

相关文章: