tbats 预测持续偏低答案

【问题标题】：tbats forecast consistently lowtbats 预测持续偏低
【发布时间】：2017-01-21 22:50:25
【问题描述】：

我有下面的代码，它有一个函数 PositiveTBATS，它在时间序列上训练一个 tbats 模型，然后对其进行预测。该函数将日志转换应用于时间序列，在将 0 替换为 0.001 以避免日志转换的 -inf 值之后。对数转换是为了防止预测返回负值。然后我有另一段代码将函数并行应用于多个时间序列。我遇到的问题是预测的高端似乎总是比实际数据低一点。我想知道是否有我可以在 tbats 模型中调整的参数，这可能有助于在高端获得更高的预测值。预测的低值与真实数据非常接近。

##Parallelizing TBATS Model Training

## Making tbats forecast positive
PositiveTBATS<-function(y){
  z<-replace(y,y==0,0.001)
  x <- log(z)
  fit <- tbats(x, use.box.cox=FALSE)
  fit$lambda <- 0
  fit$control$use.box.cox <- TRUE
  fc <- forecast(fit,h=20)
  fc$x <- exp(x)
  fc
}


# Calculate the number of cores
no_cores <- floor(detectCores()/4)

# Initiate cluster
cl <- makeCluster(no_cores)
clusterEvalQ(cl, library(forecast))

tbatsList<-list(mts2DataTs1, mts2DataTs2)

tbatsModels<-parLapply(cl, tbatsList,
                   PositiveTBATS)

stopCluster(cl)


Data:

dput(mts2DataTs1[1:100])
c(50, 48, 47, 41, 33, 24, 23, 24, 25, 31, 36, 48, 56, 68, 79, 
81, 87, 90, 81, 87, 90, 86, 79, 72, 60, 50, 39, 29, 30, 30, 31, 
29, 31, 35, 44, 54, 71, 70, 83, 87, 93, 98, 104, 105, 101, 92, 
94, 83, 76, 66, 64, 55, 48, 42, 38, 33, 34, 36, 47, 51, 58, 65, 
71, 81, 89, 86, 89, 89, 86, 75, 73, 74, 57, 49, 41, 32, 33, 25, 
24, 26, 28, 33, 42, 56, 61, 71, 74, 77, 84, 91, 90, 91, 91, 89, 
93, 90, 79, 66, 66, 48)


dput(mts2DataTs2[1:100])
c(2, 2, 1, 0, 0, 1, 2, 0, 1, 4, 8, 7, 7, 6, 5, 5, 4, 3, 1, 5, 
9, 5, 3, 2, 0, 0, 1, 0, 1, 0, 0, 2, 1, 5, 6, 5, 3, 2, 5, 4, 6, 
5, 3, 4, 2, 5, 2, 1, 0, 4, 1, 2, 2, 2, 1, 1, 2, 1, 2, 7, 7, 3, 
7, 3, 3, 2, 0, 4, 1, 3, 4, 1, 3, 0, 1, 3, 1, 0, 1, 3, 2, 4, 4, 
2, 4, 5, 4, 3, 8, 3, 3, 5, 4, 3, 1, 1, 1, 2, 1, 1)

【问题讨论】：

标签： r time-series forecasting

【解决方案1】：

您的数据是季节性的，但您没有在 TBATS 函数调用中指定季节性时段。您也不会对 PositiveTBATS 函数中的预测部分进行逆变换。

另外，对于您在此处提供的任何一个系列，我都不会使用对数转换。您的第二个系列在训练数据中包含很多零，这里的零也不例外。如果您不想要负预测值，只需将预测截断为零即可。

像这样修改你的 tbats 函数，它会做你想做的事。

PositiveTBATS<-function(y){
  fit <- tbats(y, seasonal.periods = 24)
  fc <- forecast(fit,h=20)  
  mean_fc <- pmax(fc$mean,0)
  return(mean_fc)
}

【讨论】：

感谢您的建议。我试过了，但它并没有改善预测。我之前没有提到它，但是 mts2DataTs1
如果您将类指定为带有季节性周期的 msts，那么您很好。看起来您正在处理每小时数据。您可能想要探索不同频率的数据，并可能考虑对不同频率的预测进行某种协调（例如，查看 thief 包）。