【问题标题】:CUDA SDK examples throw various errors in multi-gpu systemCUDA SDK 示例在多 GPU 系统中引发各种错误
【发布时间】:2013-02-23 14:00:53
【问题描述】:

我有一个运行 Ubuntu Precise 的 Dell Precision Rack,配备两个 Tesla C2075 和一个显示设备 Quadro 600。我最近在我的台式计算机上完成了一些测试,现在尝试将东西移植到工作站。

由于 CUDA 不存在,我根据this guide 安装它,并根据this suggestions 调整 SDK Makefiles。

我现在面临的是没有一个样本(我确实测试了 10 个不同的样本)正在运行。这些是我得到的错误:


[deviceQuery] starting...

./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 10
-> invalid device ordinal
[deviceQuery] test results...
FAILED

> exiting in 3 seconds: 3...2...1...done!

[MonteCarloMultiGPU] starting...

CUDA error at MonteCarloMultiGPU.cpp:235 code=23510 (cudaErrorInvalidDevice) "cudaGetDeviceCount(&GPU_N)"MonteCarloMultiGPU
==================
Parallelization method  = threaded
Problem scaling         = weak
Number of GPUs          = 0
Total number of options = 0
Number of paths         = 262144
main(): generating input data...
main(): starting 0 host threads...
Floating point exception (core dumped)

[reduction] starting...

reduction.cpp(124) : cudaSafeCallNoSync() Runtime API error 10 : invalid device ordinal.

[simplePrintf] starting...

simplePrintf.cu(193) : CUDA Runtime API error 10: invalid device ordinal.

如您所见,大多数错误都指向 cudaGetDeviceCount 调用的问题,该调用返回错误代码 10。根据手册,问题是:

cudaErrorInvalidDevice: This indicates that the device ordinal supplied by the user does not correspond to a valid CUDA device.

不幸的是,我能找到的唯一解决方案是检查设备的电源插头。我这样做了,没有任何问题。重新启动工作站也无济于事。

我很乐意提供有关我的配置的更多详细信息。只需发表评论!

【问题讨论】:

  • 这与 StackOveflow 无关。我建议检查您是否有/dev/nvidia* 设备文件。如果您不这样做,请阅读 Linux 入门指南中有关手动创建它们的说明。
  • @talonmies 在我的开发中有nvidia0nvidiactl。应该有多少文件?
  • 每个 GPU 应该有一个,因此您的系统需要三个。

标签: cuda ubuntu-12.04 multi-gpu


【解决方案1】:

由于我最初的问题的 cmets,我能够find 一个解决方案。我跟着this guide学习了如何正确设置rc.local(别忘了chmod你的脚本)。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2023-03-14
    • 2014-12-17
    • 1970-01-01
    • 1970-01-01
    • 2011-07-27
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多