【问题标题】:Segmentation fault (core dumped) when training more than one Keras NN models训练多个 Keras NN 模型时出现分段错误(核心转储)
【发布时间】:2018-06-13 15:15:42
【问题描述】:

我正在优化我的神经网络的超参数,为此我使用不同的超参数递归地训练网络。它按预期工作,直到经过一些迭代,当创建一个新的训练网络时,它会因错误“Segmentation fault (core dumped)”而死。

此外,我正在使用 GPU 进行训练,并且我在 Nvidia Jetson TX2 和 Python3.5 上执行此操作。另外,我正在使用带有 TensorFlow 后端的 Keras。

【问题讨论】:

  • 如果你能贴出错误堆栈,我们会更容易帮助你
  • 问题是它只是死了,除此之外它不会打印任何其他内容
  • 其实我用gdb得到了这个:Thread 1 "python3.5" received signal SIGSEGV, Segmentation fault。 tensorflow::TF_SessionReleaseCallable(TF_Session*, long, TF_Status*) () 中的 0x0000007f9ece1174 来自 /home/nvidia/.local/lib/python3.5/site-packages/tensorflow/python/_pywrap_tensorflow_internal.so

标签: python-3.x tensorflow segmentation-fault keras nvidia-jetson


【解决方案1】:

如果您使用 Keras 2 在 GPU 上运行 K.clearsession(),您可能会遇到分段错误。 如果您的代码中有此内容,请尝试将其删除!

【讨论】:

  • 我的代码中确实有一个,但删除它后,我得到了相同的结果
  • 我发现了第二个隐藏的 K.clearsession(),删除它后,它现在可以工作了!感谢您的帮助
猜你喜欢
  • 1970-01-01
  • 2017-08-07
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多