【问题标题】:nvidia-smi executable file not found未找到 nvidia-smi 可执行文件
【发布时间】:2018-04-16 23:21:04
【问题描述】:

我在nvidia-docker repo 中遇到了关于这个确切问题的 3 个不同问题,但实际上无法弄清楚出了什么问题。

我是一个重度 docker 用户,但我不太了解这些问题中使用的术语和解决方案。

无论我是否以 sudo 的身份运行 nvidia-smi,一切正常,我得到标准输出。 我的 nvidia-docker-plugin 已启动并正在运行,当我运行 nvidia-docker run --rm nvidia/cuda nvidia-smi 时会收到这些消息:

nvidia-docker-plugin | 2017/11/04 09:14:18 收到卷“nvidia_driver_387.22”的挂载请求 块引用 英伟达码头插件| 2017/11/04 09:14:18 收到卷“nvidia_driver_387.22”的卸载请求

我还尝试运行deepo 存储库,但由于我的所有容器在启动时都退出,因此无法使其工作,并且nvidia-docker run --rm nvidia/cuda nvidia-smi 输出错误:

container_linux.go:247:启动容器进程导致“exec:\”nvidia-smi\“:$PATH 中找不到可执行文件” /usr/bin/docker-current:来自守护进程的错误响应:oci 运行时错误:container_linux.go:247:启动容器进程导致“exec:\”nvidia-smi\“:$PATH 中找不到可执行文件”。

我做错了什么?

我运行 Fedora 26,如果它有什么不同的话

【问题讨论】:

    标签: docker nvidia-docker


    【解决方案1】:

    在 Ubuntu 上,您应该安装 nvidia-modprobe 软件包。我知道这也存在于 Fedora 中。出于某种原因,这种依赖关系也不需要记录。

    【讨论】:

      【解决方案2】:

      我刚刚解决了这个问题。

      删除与nvidia-docker-plugin 相关的卷解决了该问题。

      对于未来的读者,只需读出您 nvidia-docker-plugin 上的日志消息,查找挂载/卸载日志行,然后使用以下命令删除卷

      docker volume rm -f <volume_to_remove> 其中volume_to_remove 应该类似于nvidia_driver_387.22(与我的情况相符)

      问题似乎是在创建卷时映射到 nvidia-smi 调用,删除并重新附加卷可以解决此问题

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2022-01-13
        • 2021-10-02
        • 2016-12-18
        • 2021-09-10
        • 2018-07-29
        • 2023-03-06
        相关资源
        最近更新 更多