【发布时间】:2012-08-02 17:00:03
【问题描述】:
假设块之间没有通信,当我从一个 CUDA 网格中的一个进程启动 N 个 CUDA 块和我启动 N 个 MPI 进程且每个进程一个 CUDA 块时,效率是否存在差异?
【问题讨论】:
-
这完全取决于 CPU 和 GPU 的能力。
标签: parallel-processing cuda mpi
假设块之间没有通信,当我从一个 CUDA 网格中的一个进程启动 N 个 CUDA 块和我启动 N 个 MPI 进程且每个进程一个 CUDA 块时,效率是否存在差异?
【问题讨论】:
标签: parallel-processing cuda mpi
一如既往:视情况而定。
如果您没有使用支持Hyper Q 的设备的 CUDA5,则在一个进程中启动网格 CUDA 网格应该更有效。否则,我可能无法确定唯一的方法来确保它正在测试。
你可以看this video,特别是黄仁勋讲的部分Hyper Q
【讨论】: