【发布时间】:2017-09-07 19:33:52
【问题描述】:
在 Nvidia 网站上,他们声称 MXNet 使用 NCCL (https://developer.nvidia.com/nccl)。但是,我没有从 MXNet 的 github 存储库中找到他们实际使用 NCCL 库的任何参考。
在chainer博客中,他们还声称chainer在4个GPU上实现了比MXNet更好的性能,因为chainer中使用了NCCL库。(https://chainer.org/general/2017/02/08/Performance-of-Distributed-Deep-Learning-Using-ChainerMN.html)
在 MXNet 存储库中的一些旧帖子中,我可以看到他们在谈论将 NCCL 库包含在 MXNet 中的困难。
我的第一个问题是,有没有带有 NCCL 库的 MXNet 版本? 其次,使用 NCCL 库可能对性能产生什么影响(即更少的内存使用,更少的跨多个 GPU 的通信开销)?
【问题讨论】:
标签: machine-learning nvidia mxnet multi-gpu