【发布时间】:2017-01-21 22:50:25
【问题描述】:
我有下面的代码,它有一个函数 PositiveTBATS,它在时间序列上训练一个 tbats 模型,然后对其进行预测。该函数将日志转换应用于时间序列,在将 0 替换为 0.001 以避免日志转换的 -inf 值之后。对数转换是为了防止预测返回负值。然后我有另一段代码将函数并行应用于多个时间序列。我遇到的问题是预测的高端似乎总是比实际数据低一点。我想知道是否有我可以在 tbats 模型中调整的参数,这可能有助于在高端获得更高的预测值。预测的低值与真实数据非常接近。
##Parallelizing TBATS Model Training
## Making tbats forecast positive
PositiveTBATS<-function(y){
z<-replace(y,y==0,0.001)
x <- log(z)
fit <- tbats(x, use.box.cox=FALSE)
fit$lambda <- 0
fit$control$use.box.cox <- TRUE
fc <- forecast(fit,h=20)
fc$x <- exp(x)
fc
}
# Calculate the number of cores
no_cores <- floor(detectCores()/4)
# Initiate cluster
cl <- makeCluster(no_cores)
clusterEvalQ(cl, library(forecast))
tbatsList<-list(mts2DataTs1, mts2DataTs2)
tbatsModels<-parLapply(cl, tbatsList,
PositiveTBATS)
stopCluster(cl)
Data:
dput(mts2DataTs1[1:100])
c(50, 48, 47, 41, 33, 24, 23, 24, 25, 31, 36, 48, 56, 68, 79,
81, 87, 90, 81, 87, 90, 86, 79, 72, 60, 50, 39, 29, 30, 30, 31,
29, 31, 35, 44, 54, 71, 70, 83, 87, 93, 98, 104, 105, 101, 92,
94, 83, 76, 66, 64, 55, 48, 42, 38, 33, 34, 36, 47, 51, 58, 65,
71, 81, 89, 86, 89, 89, 86, 75, 73, 74, 57, 49, 41, 32, 33, 25,
24, 26, 28, 33, 42, 56, 61, 71, 74, 77, 84, 91, 90, 91, 91, 89,
93, 90, 79, 66, 66, 48)
dput(mts2DataTs2[1:100])
c(2, 2, 1, 0, 0, 1, 2, 0, 1, 4, 8, 7, 7, 6, 5, 5, 4, 3, 1, 5,
9, 5, 3, 2, 0, 0, 1, 0, 1, 0, 0, 2, 1, 5, 6, 5, 3, 2, 5, 4, 6,
5, 3, 4, 2, 5, 2, 1, 0, 4, 1, 2, 2, 2, 1, 1, 2, 1, 2, 7, 7, 3,
7, 3, 3, 2, 0, 4, 1, 3, 4, 1, 3, 0, 1, 3, 1, 0, 1, 3, 2, 4, 4,
2, 4, 5, 4, 3, 8, 3, 3, 5, 4, 3, 1, 1, 1, 2, 1, 1)
【问题讨论】:
标签: r time-series forecasting