【问题标题】:GCloud Ml-engine: training output directoryGCloud Ml-engine:训练输出目录
【发布时间】:2017-08-25 20:14:23
【问题描述】:

我已经通过这样的本地使用命令进行了培训:

gcloud ml-engine jobs submit training task43 --module-name=train.train --config=config.yaml --job-dir=gs://root-album-8512 --package-path=train --region=asia-east1 --staging-bucket=gs://root-album-8512

训练后,我在哪里可以找到我的输出训练目录?在我的日志作业中写道“将模型检查点保存到 /user_dir/runs/1503579423/checkpoints/model-227400”

但我不知道它在哪里。当我检查我的存储或存储桶时,没有这样的目录。

【问题讨论】:

  • 看起来是保存在容器上的。您确定将其指向 gs 存储桶吗?
  • 在我的命令中,我只定义了作业目录“--job-dir=gs://root-album-8512”和暂存桶“--staging-bucket=gs://root-专辑 8512”。但是我没有为我的输出训练定义目录。

标签: tensorflow directory output google-cloud-ml-engine


【解决方案1】:

--job-dir 的值作为命令行参数“job-dir”的值传递给您的代码。因此,您的代码需要从命令行参数中获取值,并将该值与模型保护程序一起使用,以将您的检查点保存到该位置。

如果您没有为模型保存器设置位置,那么它最终会保存到本地目录而不是您的 GCS 存储桶,并且在作业结束后将不可用。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-08-29
    • 1970-01-01
    • 2019-08-02
    • 1970-01-01
    • 2018-03-24
    相关资源
    最近更新 更多