【发布时间】:2019-09-08 13:47:39
【问题描述】:
我正在构建一个 pyspark 应用程序,该应用程序失败了很多,并且有很多带有很多步骤的作业,因此无法使用 cluster id 和 step id 进行搜索。 emr 保存 spark 的当前格式如下
S3/buckt-name/logs/sparksteps/j-{clusterid}/steps/s-{stepid}/stderr.gz
我想要一些可追踪的东西来代替 {clusterid} 和 {stepid},例如 clustername+datetime 和 step-name
我看到了 log4j.properties,它有一个名为 datepattern 的东西,但它没有用 datetime 保存任何东西
【问题讨论】:
标签: apache-spark pyspark log4j amazon-emr