Spark提供WebUI可以实时查看Application的运行状态。但是当你想用WebUI查看任意completed applications的运行历史记录时,可能会在浏览器中显示如下信息

Spark History Server配置

这主要是由于没有设置eventLog.dir所导致的。提到eventLog.dir,就要说到Spark History Server,通过配置History Server,可以在application执行的过程中记录下了日志事件信息,以便其完成后查看。

 

配置spark-default.conf

spark.eventLog.enabled           true
spark.eventLog.dir               hdfs://BDTEST01:9000/SparkLogs
spark.yarn.historyServer.address BDTEST01:18080

 

配置spark-env.sh

export SPARK_HISTORY_OPTS="-Dspark.history.ui.port=18080 -Dspark.history.retainedApplications=10 -Dspark.history.fs.logDirectory=hdfs://BDTEST01:9000/SparkLogs"

 

注:spark.eventLog.dir或spark.history.fs.logDirectory可以配置成不一样的路径,但是目录必须已经存在,否则History Server无法启动!(两者区别参阅参考链接)

 

启动History Server

./start-history-server.sh

 

浏览器中打开Server WebUI,端口18080

Spark History Server配置

对于任意application,显示运行时间线,点击描述,还可以查看详细历史记录,例如下图所示

Spark History Server配置

 

Reference:

http://www.cnblogs.com/luogankun/p/3981645.html

 

END

相关文章:

  • 2021-06-21
  • 2022-01-28
  • 2021-11-19
  • 2021-06-29
  • 2021-08-19
  • 2022-01-07
  • 2021-10-17
猜你喜欢
  • 2022-12-23
  • 2021-09-02
  • 2021-06-04
  • 2021-09-11
  • 2021-06-05
  • 2022-12-23
  • 2021-08-08
相关资源
相似解决方案