【发布时间】:2020-02-03 21:25:07
【问题描述】:
我在使用 MultiWorkerMirroredStrategy() 在 Google AI 平台 (CMLE) 上训练自定义估算器时遇到以下错误。
ValueError: Unrecognized task_type: 'master', valid task types are: "chief", "worker", "evaluator" and "ps".
MirroredStrategy() 和 PamameterServerStrategy() 在 AI-Platform 上使用各自的 config.yaml 文件运行良好。我目前不为任何操作提供设备范围。 两者都没有我在会话配置中提供任何设备过滤器,tf.ConfigProto(device_filters=device_filters)。
我用于通过 MultiWorkerMirroredStrategy() 进行训练的 config.yaml 文件是:
trainingInput:
scaleTier: CUSTOM
masterType: standard_gpu
workerType: standard_gpu
workerCount: 4
masterType 输入是在 AI 平台上提交训练作业所必需的。
注意:它显示 'chief' 为有效的任务类型,而 'master' 为无效。我在 setup.py 中为 trainer 包提供了 tensorflow-gpu==1.14.0。
【问题讨论】:
-
酋长等参考tensorflow 2.0。 ai 平台可能正在运行 1.x 运行时
-
嗨@Lak。我没有收到错误,它显示 'chief' 为 valid 任务类型,而 'master' 显示为 invalid。我在
setup.py中提供tensorflow-gpu==1.14.0用于培训包。 -
我已经用你上面的评论更新了这个问题(你正在使用 tensorflow-gpu)并在下面回答
-
@SWAPNILMASUREKAR 你能在 AI Platform Training 上再试一次吗?这可能已经修复。
标签: tensorflow google-cloud-platform google-cloud-ml tensorflow-estimator gcp-ai-platform-training