【发布时间】:2021-08-13 08:56:35
【问题描述】:
我是 AWS Glue 的新手,我想了解 Spark Job 的行为方式。我有一个由于 S3 PUTS 高而失败的 Spark 作业。一些文件已被处理(要明确成功处理的文件已写入接收器存储桶),而其他文件未处理,请注意尚未达到“作业提交”。如果启用作业书签,它是否仍会重新处理已写入接收器的那些文件,还是会从失败时开始执行增量更新?
【问题讨论】:
标签: amazon-web-services scala apache-spark bigdata aws-glue