【问题标题】:Tensorflow Cuda Error failed to get device attribute 13 for device 0Tensorflow Cuda 错误无法获取设备 0 的设备属性 13
【发布时间】:2020-08-14 13:00:38
【问题描述】:

我在使用 tensorflow-keras 训练神经网络时遇到问题。我收到此错误:

F tensorflow/stream_executor/lib/statusor.cc:34] 尝试获取 值而不是处理错误内部:获取设备失败 设备 0 的属性 13:CUDA_ERROR_UNKNOWN:未知错误

我最初收到此错误。然后我参考了failed-to-get-device-attribute-13-for-device-0中的解决方案。我更新了图形驱动程序。这工作了大约 3-4 次,现在我又遇到了同样的错误。

以下是我的环境的详细信息:

  1. Python 3.7 (Anaconda)
  2. 张量流 2.1
  3. Nvidia GeForce RTX 2060,6GB 显卡
  4. Windows 10 版本 1809

【问题讨论】:

  • 你有什么版本的cuda驱动? nvidia-smi 的输出是什么?
  • 驱动版本:431.23; CUDA 版本:10.1

标签: python-3.x tensorflow gpu tensorflow2.x


【解决方案1】:

在我的情况下,限制 GPU 内存是有效的。

在代码开头添加以下代码段:

import tensorflow as tf

gpus = tf.config.experimental.list_physical_devices('GPU')
tf.config.experimental.set_memory_growth(gpus[0], True)

【讨论】:

  • 试过了。它适用于某些运行,然后我再次收到此状态。我还观察到,如果我有 2 个编辑器的程序需要 GPU(“未运行”、Visual Code 和具有相同虚拟环境的 Pycharm),我会收到此错误,尽管没有具体原因,但纯粹是观察。
猜你喜欢
  • 2020-05-18
  • 1970-01-01
  • 1970-01-01
  • 2020-03-02
  • 2019-12-20
  • 2013-01-25
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多