【问题标题】:Google Cloud DL Container deployed to GCE with GPU can't find CUDA Device使用 GPU 部署到 GCE 的 Google Cloud DL 容器找不到 CUDA 设备
【发布时间】:2019-11-14 23:37:52
【问题描述】:

我将 Pytorch 映像用于 GPU:gcr.io/deeplearning-platform-release/pytorch-gpu.1-2:latest。我使用 K80 和 V100 GPU 将它部署到 GCE。

import torch
torch.cuda.device_count()
#returns 0

Cuda 已安装。当我 ssh 进入 docker 容器并在终端上运行以下命令时,我可以看到它。

cat /usr/local/cuda/version.txt
CUDA Version 10.0.130

仅供参考,来自终端的 nvidia-smi 命令不起作用。我究竟做错了什么?还是docker镜像有问题?

【问题讨论】:

    标签: google-compute-engine nvidia-docker


    【解决方案1】:

    似乎没有正确安装 NVIDIA 驱动程序。请注意“each version of CUDA requires a minimum GPU driver version or a later version.”要检查您的 CUDA 版本所需的最低驱动程序,请参阅此链接:Toolkit and Compatible Driver Versions

    你可以关注这个link to install the driver manually。你也可以找到一些libraries that needs to be installed in this link

    【讨论】:

      猜你喜欢
      • 2019-11-12
      • 2021-10-23
      • 2017-01-08
      • 2020-10-06
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2012-04-23
      • 2017-05-27
      相关资源
      最近更新 更多