【问题标题】:Understanding "nvidia-smi topo -m" output了解“nvidia-smi topo -m”输出
【发布时间】:2019-08-17 05:59:28
【问题描述】:

为了在系统上利用 GPU,我希望能够绘制框图并了解“nvidia-smi topo -m”输出所表示的连接。

这是一个示例输出:

有人可以提供一个系统级框图吗?连接的描述也会很棒。我相信这会帮助很多人利用他们的多 GPU 系统。

【问题讨论】:

  • 这个节点是什么?看起来不像 DGX1。
  • 你试过hwloc包中的lstopo命令吗?
  • @GillesGouaillardet 好主意,我什至没有考虑过使用 MPI 方面的工具。
  • 请注意,即使 hwloc 项目由 Open MPI 项目托管,这也是一个独立于 MPI 库的独立包。请注意,您可能必须自己构建 hwloc 并使用 --with-cuda 进行配置
  • @GillesGouaillardet 如何检查 hwloc 是否使用 CUDA 支持编译?所以我不能依赖包管理器安装的hwloc?

标签: cuda gpu mpi pci-e multi-gpu


【解决方案1】:

您有两个 CPU 插槽。每个 CPU 都有一个通向两个 PCIe 交换机的 PCIe 主机桥 (PHB)。每个(两次乘以 2)PCIe 交换机都有两个连接到它的 GPU,总共八个。

【讨论】:

  • 其实我很喜欢这篇arxiv论文中的图片:arxiv.org/pdf/1903.04611.pdf
  • 太棒了!我认为这会帮助很多人。如果 nvidia 将它内置到 nvidia-smi 中,那就太棒了,
猜你喜欢
  • 2023-03-31
  • 2017-04-17
  • 2018-06-29
  • 1970-01-01
  • 1970-01-01
  • 2022-07-04
  • 2021-10-02
  • 1970-01-01
  • 2018-10-20
相关资源
最近更新 更多