【发布时间】:2016-07-28 00:01:06
【问题描述】:
我正在尝试找出最近 Spark 应用程序在生产中失败的根本原因。当 Spark 应用程序运行时,我可以检查 NodeManager 的 yarn.nodemanager.log-dir 属性以获取 Spark 执行器容器日志。
容器有两个正在运行的 Spark 应用程序的日志
这是容器日志的视图: drwx---x--- 3 纱线纱线 51 Jul 19 09:04 application_1467068598418_0209 drwx---x--- 5 纱线纱线 141 Jul 19 09:04 application_1467068598418_0210
但是当应用程序被杀死时,两个应用程序日志都会被自动删除。我已将 Yarn 中的所有日志保留设置等设置为一个非常大的数字。但是一旦 Spark 应用程序崩溃,这些日志仍然会被删除。
问题:当 Spark 应用程序由于某种原因崩溃时,我们如何将这些 Spark 应用程序日志保留在 Yarn 中以进行调试。
【问题讨论】:
标签: apache-spark hadoop-yarn cloudera