【发布时间】:2017-04-12 10:37:07
【问题描述】:
我们是两名学生,正在研究我们的考试项目,我们正在尝试在 Raspberry Pi 集群上运行 TensorFlow。我们正在尝试运行此示例(MNIST)https://github.com/ischlag/distributed-tensorflow-example/blob/master/example.py。 (我们做了一些小的调整,更新了一些已弃用的过程调用)。
当我们用自己的脚本运行程序时:
python /home/alarm/src/tensorflow/tf_mnist_example/examples.py --job_name="ps" --index_data=0 &
对于 {1..7} 中的 i 做 ssh -o "BatchMode yes" alarm@rpi0$i python /home/alarm/src/tensorflow/tf_mnist_example/examples.py --job_name="worker" --index_data="$i - 1"
完成
节点运行 python 脚本,但在终端提示符下,我们一遍又一遍地遇到此错误。 错误:CreateSession 仍在等待来自工作人员 tensorflow 的响应:/job:ps/replica:0/task:0 错误:CreateSession 仍在等待来自工作人员 tensorflow 的响应:/job:worker/replica:0/task:0 错误:CreateSession 仍在等待来自工作人员张量流的响应:/job:worker/replica:0/task:2 错误:CreateSession 仍在等待来自工作人员张量流的响应:/job:worker/replica:0/task:3 错误:CreateSession 仍在等待来自工作人员张量流的响应:/job:worker/replica:0/task:4 错误:CreateSession 仍在等待来自工作人员张量流的响应:/job:worker/replica:0/task:5 错误:CreateSession 仍在等待来自 worker tensorflow 的响应:/job:worker/replica:0/task:6
希望收到您的来信 瑞典最好的尊重。
【问题讨论】:
标签: tensorflow