【问题标题】:Yarn shows the jobs is succeeded but the EMR shows the step is still runningYarn 显示作业已成功,但 EMR 显示该步骤仍在运行
【发布时间】:2018-02-11 09:57:28
【问题描述】:

Yarn 显示作业已成功(在 Yarn UI 中),但 EMR 显示该步骤(在 EMR 控制台 UI 中)仍在运行,并且永远显示为 tat。任何想法 ? 我正在将 s3 作为 json 部分文件写入,我在驱动程序日志中看到了这一点:

Caused by: java.io.IOException: File already exists:s3n:

但驱动程序仍在运行,但纱线显示成功。

【问题讨论】:

    标签: hadoop apache-spark apache-spark-sql hadoop-yarn amazon-emr


    【解决方案1】:

    我遇到了同样的问题,s3 告诉我文件已经存在并且工作正在按预期完成。首先,不要使用s3n://,而是使用s3://,按照this issue 中的建议。

    为了摆脱IOException,我启用了EMRFS consistent view,推荐用于“使用Amazon S3 作为数据存储运行快速、连续步骤的集群”,这就是我的情况。 YMMV。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-11-22
      • 1970-01-01
      • 2021-12-26
      • 2021-04-07
      • 2019-10-10
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多