【问题标题】:Tensorflow - Any input gives me same outputTensorflow - 任何输入都会给我相同的输出
【发布时间】:2016-09-16 22:13:32
【问题描述】:

我面临一个非常奇怪的问题,我正在使用 tensorflow 构建 RNN 模型,然后在完成训练后使用 tf.Saver 存储模型变量(全部)。

在测试期间,我只是再次构建推理部分并将变量恢复到图形中。恢复部分没有报错。

但是当我开始对评估测试进行测试时,我总是从推理中得到相同的输出,即对于所有测试输入,我得到相同的输出。

我在训练期间打印了输出,我确实看到不同训练样本的输出不同,成本也在下降。 但是当我进行测试时,无论输入是什么,它总是给我相同的输出。

有人可以帮助我理解为什么会发生这种情况吗?我想发布一些最小的示例,但由于我没有收到任何错误,我不确定我应该在这里发布什么。如果可以帮助解决问题,我将很乐意分享更多信息。

我在训练和测试期间的推理图之间的一个区别是 RNN 中的时间步数。在训练期间,我在更新梯度之前为一批训练 n 步(n = 20 或更多),而对于测试,我只使用一个步骤,因为我只想预测该输入。

谢谢

【问题讨论】:

    标签: tensorflow recurrent-neural-network


    【解决方案1】:

    我已经能够解决这个问题。这似乎正在发生,因为我的输入特征之一在其原始值中非常占主导地位,因此在一些操作之后所有值都收敛到单个数字。 扩展该功能有助于解决此问题。

    谢谢

    【讨论】:

    • 嗨,我有同样的问题,不同的输入在同一个输出处收敛。我不知道为什么。你能告诉我缩放是做什么的吗?
    【解决方案2】:

    您能否创建一个可重现的小案例并将其作为错误发布到 https://github.com/tensorflow/tensorflow/issues ?这将有助于这个问题得到合适的人的关注。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-01-23
      • 1970-01-01
      • 1970-01-01
      • 2020-08-02
      • 2013-06-06
      • 2020-05-18
      相关资源
      最近更新 更多