【问题标题】:Distributed Tensorflow: check failed: size>=0分布式张量流:检查失败:大小> = 0
【发布时间】:2017-07-31 18:42:43
【问题描述】:

我使用的是 keras 2.0.6。张量流的版本是1.3.0。

我的代码可以使用 theano 后端运行,但使用 tensorflow 后端失败:

F tensorflow/core/framework/tensor_shape.cc:241] 检查失败:size >= 0(-14428307456 vs. 0)

我想知道是否有人能想到任何可能导致这种情况的原因。

谢谢!

----更新-----

我在我的 PC 上使用 tensorflow 测试了完全相同的代码。它运行完美。

但是,当我在超级计算机上运行它时,它会抛出这个错误。

虽然这个错误看起来像溢出,但它不可能在我的 PC 上没有溢出,而是在超级计算机上溢出。

我怀疑它来自分布式计算的 tensorflow 上的一个错误。

【问题讨论】:

    标签: tensorflow tensorflow-gpu


    【解决方案1】:

    我遇到了同样的错误,但在我缩小批量大小之后,Tensorflow 运行正常。

    我认为原因是 GPU 内存不足。

    【讨论】:

      【解决方案2】:

      我遇到了错误,在我的问题中,错误来自具有不同视觉的 TF。

      错误已解决。 该模型是在 tf 1.15 中训练的,但在 tf 1.13 中冻结了模型。在 tf 1.15 中冻结它时,一切正常。

      我想你可以查看模型版本。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2018-11-05
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2019-10-12
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多