【发布时间】:2019-10-23 00:41:21
【问题描述】:
Tensorflow 在指定通信协议时允许选项“gRPC”、“gRPC+verbs”和“gRPC+mpi”。在 gRPC+verbsdocumentation 中,明确指出该协议是基于 RDMA 的。同时,在gRPC+MPIdocumentation中,根本不暗示这个,最初我假设gRPC+mpi可以在任何底层网络上运行。然而,this 研究论文暗示 gRPC+mpi 需要在 RDMA 上运行(见第 3 页末尾)。我误解了研究论文吗? gRPC+MPI 实际上可以在任何网络上运行吗?
【问题讨论】:
标签: tensorflow mpi grpc infiniband rdma