【发布时间】:2019-10-12 19:50:31
【问题描述】:
我关注tutorial 在 GCP 上构建 kubeflow。
在最后一步,在部署 the code 并使用 CPU 进行训练之后。
kustomize build . |kubectl apply -f -
分布式tensorflow遇到这个问题
tensorflow.python.framework.errors_impl.NotFoundError: /tmp/tmprIn1Il/model.ckpt-1_temp_a890dac1971040119aba4921dd5f631a;不 这样的文件或目录
[[节点:保存/SaveV2 = SaveV2[dtypes=[DT_FLOAT,DT_FLOAT,DT_FLOAT,DT_FLOAT,DT_FLOAT, DT_FLOAT、DT_FLOAT、DT_FLOAT、DT_INT64]、 _device="/job:ps/replica:0/task:0/device:CPU:0"](save/ShardedFilename, save/SaveV2/tensor_names, save/SaveV2/shape_and_slices, conv_layer1/conv2d/bias,conv_layer1/conv2d/内核, conv_layer2/conv2d/bias,conv_layer2/conv2d/kernel,dense/bias, 密集/内核,密集_1/偏差,密集_1/内核,全局步骤)]]
我找到了类似的bug report,但不知道如何解决。
【问题讨论】:
标签: tensorflow kubeflow