【发布时间】:2017-09-12 15:01:27
【问题描述】:
当我在 k8s 上运行,并且我的 tensorflow 代码在 docker 容器中时,这个日志总是显示给一些工人:
分布式 TensorFlow:
CreateSession 仍在等待工作人员的响应:/job:ps/replica:0/task:0
我不知道为什么。集群内网络正常,如何解决?
【问题讨论】:
-
详情:有些工人可以正常训练,但有些工人总是会打印该日志,docker和host的网络都很好。那么如何解决呢。
标签: tensorflow containers distribute