【发布时间】:2021-08-16 08:44:28
【问题描述】:
我的问题特别是我的输出值在标签的最小值和最大值之间。
(即:标签范围 = min(0.20) max(0.80),输出 = 始终在 0.40 左右,偏差很小)
我的模型规格是这样的:
activations = All tanh, or all Relu.
outputs = 1, inputs = 2, "cells" = 100, layers = 1.
regularization = either L2 or L1.
optimizer = SGD with momentum.
(自定义模型,不是从任何库构建的)
我的模型基于此模型:https://medium.com/@aidangomez/let-s-do-this-f9b699de31d9
无论我执行多少个 epoch,输出都以标签范围为中心。 (它在大约 1000 个 epoch 时达到这个状态,并且一直保持到 200000 个 epoch。此时误差达到某个小值(1000 个 epoch,在我的情况下,误差达到 0.00135 左右)并在剩余时间内停留在这里,减少到速度非常缓慢,甚至最终会增加)。我的学习率越小,达到这个范围值和误差值所需的时间就越长。但没有任何改进。
我知道网络可能不够“智能”。但是如果我使用 2 层而不是 1 层,则会出现相同的结果。 但除此之外,还有什么可能导致这种情况?只是寻找指针,我不要求完整的模型评估。如果有人想深入了解代码,我很乐意提供。
【问题讨论】:
标签: python c++ neural-network lstm recurrent-neural-network