【发布时间】:2018-11-07 22:49:31
【问题描述】:
作为 RNN/LSTM(无状态)的介绍,我正在训练一个包含 200 天以前数据 (X) 序列的模型,包括每日价格变化、每日交易量变化等,以及我拥有的标签/Y从当前价格到 4 个月内的价格变化百分比。基本上我想估计市场方向,而不是 100% 准确。但我得到了一些奇怪的结果......
当我使用训练数据测试我的模型时,我注意到模型的输出与实际数据相比非常合适,它只是滞后了正好 4 个月:
当我将数据移动 4 个月时,您会发现它非常适合。
我显然可以理解为什么训练数据会非常接近,因为它在训练期间已经看到了这一切 - 但为什么会滞后 4 个月?
它对验证数据做同样的事情(注意我用红色框突出显示的区域以供将来参考):
时移:
它不像训练数据那样贴合,正如你所期望的那样,但仍然太我喜欢 - 我只是不认为它可以这么准确(见小以红色矩形中的 blip 为例)。我认为该模型充当了一个幼稚的预测器,我只是无法弄清楚它是如何/为什么会这样做的。
为了从验证数据中生成这个输出,我输入了一个 200 个时间步长的序列,但是数据序列中没有任何内容说明 4 个月后 %price 的变化 - 它完全断开连接,所以它是怎么回事 那么准确吗? 4 个月的滞后显然是另一个指标,表明这里有问题,我不知道如何解释,但我怀疑两者是相关的。
【问题讨论】:
标签: neural-network keras lstm rnn training-data