【问题标题】:Keras 2.2.4 with TensorFlow 1.4.1 crashing GPU instances带有 TensorFlow 1.4.1 的 Keras 2.2.4 崩溃 GPU 实例
【发布时间】:2019-05-02 13:59:57
【问题描述】:

Keras 版本 2.2.4 的最低 TensorFlow 版本要求是多少?

我在使用 Conv2D 架构时遇到问题,GPU 实例似乎崩溃了,即我可以看到 GPU 内存稍微填满,然后正在运行的进程只是“崩溃”。没有错误,笔记本只是“冻结”。例如,训练密集模型可以正常工作。这个具有 Conv2D 架构的完全相同的笔记本在我的带有 TensorFlow 1.12.0 和 Keras 2.2.4 的笔记本电脑上运行良好。

我预计这与使用的 Keras 和 TensorFlow 版本有关。使用的 GPU 是 Tesla M10(仅支持 CUDA 8.0?)。这个 M10 的服务器有 Tensorflow 版本 1.4.1 和 Keras 2.2.4。

对于解决此问题的任何见解将不胜感激。

【问题讨论】:

  • 不,问题不是这样的。你应该陈述你的事实和证据,证明这是一个 TF 版本的问题。如果是 TF 版本的问题,那你有没有尝试升级到相同的版本? (1.12) 您是否尝试在终端中运行代码?冻结是什么意思? (也许它的交换)添加更多信息,以便人们可以帮助你。
  • 您的 Dense 模型工作的事实表明它可能存在内存消耗问题,但没有任何关于您的模型的信息无法更准确地判断。首先检查你的参数号和批量大小,这些比仅仅看着“内存填满一点”的事情要多得多。
  • 如果您遇到兼容性问题,您可能根本无法运行任何模型,至少根据我的经验。
  • 无法收集有关“冻结”/“崩溃”的信息。这些模型以前适用于旧版本的 Keras。问题是没有显示错误。因此,除了描述 GPU 内存已填满(可用的 4 GB 中大约 100 到 400 Mib)之外,在 GPU 上运行的进程然后就消失了,这就是我能做的。这也不是批量大小、内存大小限制或传输速度问题。在笔记本初始化 GPU 进行训练后,看起来 GPU 实例/正在运行的 GPU 处理大约会崩溃 2-3 秒
  • 您可能会收到错误消息,但看不到它们(可能在笔记本控制台中),但由于我们不知道您是如何运行代码的,因此我们无法提供进一步的帮助。这就是为什么我提到在终端的 python 脚本中运行它,以便您可以看到更多信息。

标签: tensorflow keras gpu version nvidia


【解决方案1】:

kerastensorflow 之间的版本兼容性可能是任何人都遇到过的问题。

在我的回答 here 中,您可以使用的一种组合是 tensorflow-gpu 1.4keras 2.0.8 。您也可以查看here 了解更多组合。

如果您需要使用keras 2.2.4,则必须安装tensorflow-gpu 1.11 及更高版本,这需要cuda 9

【讨论】:

  • 非常感谢,我将对此进行测试。找不到您链接到的资源,这很有帮助。
【解决方案2】:

Keras - Tensorflow 版本的兼容性是开发者多次面临的问题。

只需检查 TensorFlow 和 Keras 的兼容性:

查看此link 了解更多信息

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2022-08-21
    • 1970-01-01
    • 2018-02-15
    • 1970-01-01
    • 1970-01-01
    • 2018-12-21
    • 2018-08-16
    • 1970-01-01
    相关资源
    最近更新 更多