【发布时间】:2016-10-14 00:39:36
【问题描述】:
在我的 Spark 程序执行期间,有时(原因对我来说仍然是个谜)纱线会杀死容器(执行程序),给出超出内存限制的消息。虽然 Spark 通过生成一个新容器重新执行任务,但我的程序确实恢复了。但是,在我的程序中,任务还会在磁盘上创建一些中间文件。当一个容器被杀死时,这些文件被留下。有没有办法可以将执行者杀死作为异常捕获,以便我可以删除留下的中间文件。显然,异常处理代码也需要在执行器运行的同一节点上运行,这样我就可以从那里删除文件。
【问题讨论】:
标签: apache-spark bigdata hadoop-yarn