【问题标题】:A grid of CUDA blocks Vs. a grid of MPI processes with a single block per processCUDA 块的网格 Vs。 MPI 进程网格,每个进程有一个块
【发布时间】:2012-08-02 17:00:03
【问题描述】:

假设块之间没有通信,当我从一个 CUDA 网格中的一个进程启动 N 个 CUDA 块和我启动 N 个 MPI 进程且每个进程一个 CUDA 块时,效率是否存在差异?

【问题讨论】:

  • 这完全取决于 CPU 和 GPU 的能力。

标签: parallel-processing cuda mpi


【解决方案1】:

一如既往:视情况而定。

如果您没有使用支持Hyper Q 的设备的 CUDA5,则在一个进程中启动网格 CUDA 网格应该更有效。否则,我可能无法确定唯一的方法来确保它正在测试。

你可以看this video,特别是黄仁勋讲的部分Hyper Q

【讨论】:

    猜你喜欢
    • 2011-05-22
    • 2011-08-28
    • 2016-01-19
    • 1970-01-01
    • 2019-02-26
    • 1970-01-01
    • 2018-12-31
    相关资源
    最近更新 更多