【问题标题】:how to save uncompressed outputs from a training job in using aws Sagemaker python SDK?如何在使用 aws Sagemaker python SDK 时保存训练作业的未压缩输出?
【发布时间】:2021-01-31 17:33:25
【问题描述】:

我正在尝试以非压缩方式将训练作业工件上传到 S3。

我熟悉可以提供给 sagemaker Estimator 的 output_dir,然后保存在 /opt/ml/output 下的所有内容都会压缩上传到 S3 输出目录。

我希望可以选择访问特定的工件,而不必每次都解压缩输出。有干净的方法吗?如果没有任何解决方法? 我感兴趣的工件是小型元数据文件 .txt 或 .csv,而在我的情况下,其余工件可能约为 1GB,因此下载和解压缩非常多。

任何帮助将不胜感激

【问题讨论】:

    标签: python boto3 amazon-sagemaker


    【解决方案1】:

    我最终使用了默认情况下以未压缩方式与指定 S3 路径同步的检查点路径。

    【讨论】:

      【解决方案2】:

      我认为您可以简单地指定一个 s3 位置路径来将您的工件保存在您的训练脚本中。但是我不完全确定 sagemaker 创建的实例是否有权直接写入 S3,也许它们也是网络隔离的。为了实时阅读 tensorflow 日志,我或多或少地按照您所说的做,但我正在使用自定义图像进行培训。有兴趣的可以看看here

      【讨论】:

      • 谢谢,我尝试了您描述的内容,但 EC2 实例没有登录 AWS 凭证。所以您没有权限
      • > 我尝试了您所描述的,但 EC2 实例没有登录 AWS 凭证我认为这不一定是真的。您应该能够在容器中获得 AWS 会话。它承担的您的 IAM 角色应该具有凭证。您可以在该角色中管理 S3 读取访问权限。
      猜你喜欢
      • 2020-05-25
      • 2018-10-04
      • 2020-11-18
      • 2021-02-08
      • 2021-04-18
      • 2021-02-14
      • 1970-01-01
      • 2020-07-17
      • 2019-07-27
      相关资源
      最近更新 更多