【发布时间】:2017-03-23 05:21:18
【问题描述】:
我正在尝试此处提供的示例: https://github.com/ischlag/distributed-tensorflow-example 我有两台机器:一台作为服务器,另一台作为工人。 (两台机器上的版本都是1.0.1)
我收到以下错误:
变量初始化... 我 tensorflow/core/distributed_runtime/master.cc:193] CreateSession 仍在等待工作人员的响应:/job:ps/replica:0/task:0 我 tensorflow/core/distributed_runtime/master.cc:193] CreateSession 仍在等待工作人员的响应:/job:worker/replica:0/task:1 我 tensorflow/core/distributed_runtime/master.cc:193] CreateSession 仍在等待 worker 的响应:/job:worker/replica:0/task:2
【问题讨论】:
-
您是否在
parameter_servers = ["pc-01:2222"] workers = [ "pc-02:2222", "pc-03:2222", "pc-04:2222"]中设置了您的ips/端口? -
是的。 pc-01 -> 是 IP 地址
-
给出你的 ip 端口组合。如果它在您的本地机器上使用 localhost:2222 localhost:2223 等
-
@Himaprasoon 我有两个不同的服务器。
:2222 和 :2222 ...这就是我给的方式
标签: tensorflow