【发布时间】:2017-11-14 05:44:10
【问题描述】:
我想创建一个可以用来预测未来日期的简单模型。我只想使用日期列表,并使用它来最好地预测未来的日期。这是我到目前为止所做的:
sales_modified = data.frame(City=sales$City, SOCreatedOn=sales$SOCreatedOn)
sales_modified = sales_modified[order(sales_modified$City,sales_modified$SOCreatedOn),]
sales_modified = unique(sales_modified)
sales_modified$rowNum = 1:length(sales_modified$City)
ggplot(data = sales_modified[1:119,], aes(x=rowNum, y=SOCreatedOn)) + geom_point(aes(color=City)) +
theme(axis.text.x = element_text(angle = 90, hjust = 1)) + facet_wrap(~City)+ geom_smooth(method="lm")
date1 = lm(SOCreatedOn ~ rowNum, data = sales_modified[1:119,])
格式化日期并将其保存在名为sales_modified 的数据框中,该数据框创建两列,一个城市和一个日期。我创建rowNum 列的原因是为了以某种方式巧妙地绘制它并创建模型。我尝试使用lm() 来计算线性模型。如何在不提供任何其他数据的情况下找到下一个未来日期?
编辑: 尝试使用 ARIMA 模型,但当我知道情况并非如此时,它只会导致一个接一个地选择日期(4/27、4/28、4/29)。
timeseries = ts(sales_modified$SOCreatedOn[1:119])
plot.ts(timeseries)
auto.arima(timeseries)
timeseriesarima = arima(timeseries, order = c(2,1,0))
timeseriesforecast = forecast.Arima(timeseriesarima, h = 5)
as.Date(timeseriesforecast$mean[1:5])
【问题讨论】:
标签: r machine-learning statistics