【问题标题】:Error when submitting training job to gcloud向 gcloud 提交训练作业时出错
【发布时间】:2018-04-20 00:48:05
【问题描述】:

我是 Google Cloud 培训的新手。

当我运行训练作业时,我收到以下错误:

(gcloud.ml-engine.jobs.submit.training) Could not copy [research/dist/object_detection-0.1.tar.gz] to [training/packages/c5292b23e57f357dc2d63baab473c04337dbadd2deeb10965e743cd8422b964f/object_detection-0.1.tar.gz]. Please retry: HTTPError 404: Not Found

我正在使用它来运行训练作业

gcloud ml-engine jobs submit training job1 \     
--job-dir=gs://${ml-project-neu}/training \
--packages research/dist/object_detection-0.1.tar.gz,research/slim/dist/slim-0.1.tar.gz \
--module-name object_detection.train \
--config cloud.yml \
--runtime-version=1.4
-- \
--train_dir=gs://${ml-project-neu}/training \
--pipeline_config_path=gs://${ml-project-neu}/data/faster_rcnn_inception_v2_pets.config

【问题讨论】:

    标签: tensorflow machine-learning gcloud google-cloud-ml


    【解决方案1】:

    确保 ${ml-poject-neu} 有效(在您的情况下它可能是空字符串);确保 gs://${ml-project-neu} 存在。并确保您与 gcloud 一起使用的凭据可以访问您的 GCS 存储桶(考虑运行 gcloud auth login)。

    【讨论】:

    • ml-project-neu 是我的存储桶名称。我验证了它,但错误仍然存​​在。不知道我应该如何进行。
    • 你介意硬编码字符串“ml-project-neu”而不是使用环境变量,例如gcloud ml-engine jobs 提交训练 job1 \ --job-dir=gs://ml-project-neu/training \ --packages research/dist/object_detection-0.1.tar.gz,research/slim/dist/slim- 0.1.tar.gz \ --module-name object_detection.train \ --config cloud.yml \ --runtime-version=1.4 -- \ --train_dir=gs://ml-project-neu/training \ -- pipeline_config_path=gs://ml-project-neu/data/faster_rcnn_inception_v2_pets.config
    • @OkDroid 如果对您有帮助,请考虑接受答案
    猜你喜欢
    • 1970-01-01
    • 2018-02-10
    • 2017-03-09
    • 1970-01-01
    • 2017-07-25
    • 1970-01-01
    • 2018-10-04
    • 2019-07-13
    • 1970-01-01
    相关资源
    最近更新 更多