【问题标题】:Training stops after successfully opening libcudnn.so.7 in colab在 colab 中成功打开 libcudnn.so.7 后训练停止
【发布时间】:2022-10-23 04:30:04
【问题描述】:
我正在使用 google colab 来训练安装了 tensorflow 1.15 的 fasterrcnn。使用免费 GPU,训练在“成功打开 libcudnn.so.7”后停止。我也尝试在没有 GPU 的情况下进行训练,但在第 1 步后训练停止。之前曾报告过类似的问题,但我似乎找不到有效的解决方案。非常感谢有关此问题的任何建议。
这是在 colab 中没有 GPU 的情况下完成的训练
这是在 colab 中使用 GPU 完成训练的时候
【问题讨论】:
标签:
tensorflow
google-colaboratory
【解决方案1】:
你是如何在 Colab 上安装 Tensorflow 1.15 的?我认为除了使用 pip 重新安装之外,您还必须降级 CUDA:
!pip uninstall tensorflow
!pip install tensorflow-gpu==1.15
!apt install --allow-change-held-packages libcudnn7=7.4.1.5-1+cuda10.0
这里是带有兼容版本的table。
如果你想查看像 libcudnn 这样的包的所有可用版本,请执行以下操作:
!apt list -a libcudnn7