【发布时间】:2017-03-29 20:42:41
【问题描述】:
我们需要使用分布式 Tensorflow 中的“Between-graph Replication”定义多个客户端(每个客户端都创建和构建 Tensorflow 会话/图)。通常,客户端和工作人员在同一个进程中,tf.train.MonitoredTrainingSession() 协调这些 Tensorflow 会话。
现在如果每个客户端和worker不在同一个进程中,并且我希望客户端使用grpc来远程驱动worker任务,我想知道tf.train.MonitoredTrainingSession()或某些API是否支持此功能,或者是否有人有任何其他解决方案或想法。 (我知道tf.Session(<grpc_url>)支持grpc,但不协调多个Tensorflow Session)
【问题讨论】:
标签: python session tensorflow distributed grpc