NVLink和NVSwitch

NVLink

NVLink主要加速CPU和NVIDIA GPU之间的互联速度，需要CPU的支持，例如IBM的Power的某些CPU支持，intel的CPU不支持；
也用于加速NVIDIA GPU和NVIDIA GPU之间的互联速度；

是一种点对点结构的串行通信协议；

版本	速度	Lans Per Link	单向速度 Per Link	Link数	In BW	Out BW	Total BW
2014年 NVLink 1.0	20GT/s	8+8 In + Out	8bit*20GT/s=20GB/s	P100 With 4 Links	80GB/s	80GB/s	160GB/s
2018年 NVLink 2.0	25GT/s	8+8 In + Out	8bit*25GT/s=25GB/s	V100 With 6 Links	150GB/s	150GB/s	300GB/s
2020年 NVLink 3.0	50GT/s	4+4 In + Out	4bit*50GT/s =25GB/s	A100 With 12 Links	300GB/s	300GB/s	600GB/s

X16 PCIe Gen3 的带宽是16bit*8GT/s=16GB/s

X16 PCIe Gen4 的带宽是16bit*16GT/s=32GB/s

eg1: GPU与GPU通过NVLink1.0互联

NVLink和NVSwitch

eg2: GPU与GPU通过NVLink1.0互联

NVLink和NVSwitch

eg3: 8*P100 Cube Mesh Topo

NVLink和NVSwitch

eg4: 8*V100 Cube Mesh Topo

NVLink和NVSwitch

NVSwitch

NVSwitch是交换芯片

6对（12个Switch）使用在1个DGX-2的Server中支持16个P100 GPU

从GPU的角度看：8对GPU之间的带宽都是300GB/s，那么合计的带宽就是300GB/s*8=2.4TB/s

从Switch的角度看：一个Switch是8个Link，6个Switch就是48Link，单向进入的速度也可以这样计算48Link*25GB/s=1.2TB/s

Switch存在的作用是避免GPU和GPU之间的通信会存在多跳；

关于NVSwitch能找到的资料只有hp30上的胶片，可以看到switch上其实有18个NVLink2.0的Port，理论的吞吐是18*50GB/s=900GB/s

NVLink和NVSwitch

可以猜测NVSwitch2.0可能实现了36个NVLink3.0的Port，理论的吞吐是1800GB/s，但是实际上使用了32个，吞吐是1600GB/s；

EX01: 12个NVSwitch 1.0连接16个V100实现0跳互联：

NVLink和NVSwitch

参考Wikichip的透视可能更加清晰：

NVLink和NVSwitch

EX02： 12个NVSwitch 2.0连接16个A100实现0跳互联：

NVLink和NVSwitch

Change List

V0.1 2019年11月9日 NVLink1.0/2.0 NVSwitch1.0

V0.2 2020年5月23日添加NVLink3.0 NVSwitch2.0

参考文献：

https://www.nvidia.com/en-us/data-center/nvlink/

https://devblogs.nvidia.com/inside-pascal/

https://images.nvidia.com/content/volta-architecture/pdf/volta-architecture-whitepaper.pdf

https://en.wikichip.org/wiki/nvidia/nvswitch

https://www.hotchips.org/hc30/2conf/2.01_Nvidia_NVswitch_HotChips2018_DGX2NVS_Final.pdf

相关文章：

2021-08-19
2021-10-25
2021-08-17
2021-12-01
2022-12-23
2021-11-25
2022-02-20

猜你喜欢

2022-12-23
2021-10-24
2021-05-02
2021-11-29
2021-07-25
2021-11-29
2022-12-23

相关资源

下载 2022-12-19
下载 2022-12-26
下载 2022-12-20
下载 2022-12-01
下载 2023-01-21

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode