【发布时间】:2020-05-28 19:34:51
【问题描述】:
在tf.device() 的帮助下,我一直在我的 GPU 上使用 tensorflow 训练一个模型,到目前为止它运行良好。我正在 Keras 中制作另一个 NN 模型,在使用 model.fit 时它给了我 OOM 错误。
谁能指导我如何解决这个问题?
【问题讨论】:
标签: python-3.x tensorflow keras out-of-memory gpu
在tf.device() 的帮助下,我一直在我的 GPU 上使用 tensorflow 训练一个模型,到目前为止它运行良好。我正在 Keras 中制作另一个 NN 模型,在使用 model.fit 时它给了我 OOM 错误。
谁能指导我如何解决这个问题?
【问题讨论】:
标签: python-3.x tensorflow keras out-of-memory gpu
当您的模型想要使用比可用内存更多的内存时,会出现 OOM(内存不足)错误。在训练之前检查您的 GPU 内存是否被某个进程占用。在 nvidia GPU 中,您可以在开始训练之前通过 cmd 中的命令 nvidia-smi 检查内存。
如果在开始训练之前没有任何进程或模型占用内存并且您仍然遇到 OOM 错误,那么您必须通过更改批量大小或减小数据大小或图像大小或通过减少模型的可训练参数来优化模型(数量神经元)。
【讨论】:
现在解决了。我切换到 google.colab 有一段时间了,但过了一段时间,我在我的设备上使用了它,它运行良好,我确实清理了中间的一些文件,并且正在试验我的 GPU,我猜其中有什么触发了解决方案。还是谢谢你。
【讨论】: