【发布时间】:2020-02-13 03:52:05
【问题描述】:
我是高性能计算领域的新手,正在学习 GPU 卡的Allreduce 操作。我发现称为ring-Allreduce 的高效集体操作要求GPU 卡的物理拓扑为树形拓扑。但是,我检查自己服务器的拓扑如下。
GPU 卡似乎由多个本地 PCIe 总线和 PCIe 主机桥连接。是总线拓扑的层次吗?
【问题讨论】:
标签: networking gpu pci-e
我是高性能计算领域的新手,正在学习 GPU 卡的Allreduce 操作。我发现称为ring-Allreduce 的高效集体操作要求GPU 卡的物理拓扑为树形拓扑。但是,我检查自己服务器的拓扑如下。
GPU 卡似乎由多个本地 PCIe 总线和 PCIe 主机桥连接。是总线拓扑的层次吗?
【问题讨论】:
标签: networking gpu pci-e
双插槽系统在每个插槽上有多个 PCIe 根端口。 PCIe 网桥连接到每个根端口,GPU 连接到网桥。
标记为 PIX 的连接位于连接到同一网桥的 GPU 之间。
标记为 NODE 的连接位于连接到两个不同网桥(在两个不同根端口上)的 GPU 之间。
标有 SYS 的连接连接到不同套接字上的根端口。
【讨论】: