【发布时间】:2013-06-09 23:10:01
【问题描述】:
我正在处理一个有很多节点的集群,每个节点都有两个 gpus。在集群中,我无法启动“nvidia-smi”来检查哪个设备正忙。我的代码在能力方面选择了最好的设备(使用 cudaChooseDevice),但是当集群为我分配相同的节点用于两个不同的作业时,我有两个任务在同一个 gpu 上运行。
我的问题是:有办法在运行时检查设备是否忙?
谢谢
【问题讨论】:
标签: cuda cluster-computing gpgpu gpu hpc