【发布时间】:2015-04-09 00:21:29
【问题描述】:
我们正在运行某些 spark 作业,并且我们看到 hdfs 中的 .sparkstaging 指导在作业完成后仍然存在。 是否需要设置任何参数才能在作业完成后删除暂存目录?
spark.yarn.preserve.staging.files 默认为 false,因此我们没有明确设置它。 我们正在使用 hortonworks 和 spark 版本 1.2 在纱线上运行 spark
问候, 馒头
【问题讨论】:
-
旧线程,但我只是偶然发现了类似的东西,对我来说,
.sparkStaging目录持续存在的原因是,如果 YARN 应用程序获取KILLED,该目录不会被删除。如果您有很多应用程序无论出于何种原因获得KILLED,其中很多都可以永久存在。
标签: apache-spark