【发布时间】:2022-11-25 22:55:16
【问题描述】:
我已经通过我们用来运行 Jenkins 作业的 k8s 代理容器在 docker 中配置了 Hadoop 和 spark,我们正在使用 AWS EKS。但是在运行 spark-submit 作业时,我们收到以下错误
py4j.protocol.Py4JJavaError: An error occurred while calling o40.exists.
com.amazonaws.services.s3.model.AmazonS3Exception: Status Code: 403, AWS Service: Amazon S3, AWS Request ID: xxxxxxxxx, AWS Error Code: null, AWS Error Message: Forbidden, S3 Extended Request ID: xxxxxxxxxxxxxxx/xxxxxxxx
我们在 k8s 中创建了一个服务帐户,并添加了注释作为 IAM 角色。(访问在 aws 中创建的 s3 的 IAM 角色) 我们看到它可以从 s3 复制文件,但在工作中出现此错误并且无法找出根本原因。
注意:星火版本 2.2.1 hadoop 版本:2.7.4
谢谢
【问题讨论】:
标签: apache-spark hadoop amazon-eks