【发布时间】:2018-09-26 12:59:54
【问题描述】:
我的 Apache Spark 应用程序处理巨大的 RDD 并通过历史服务器生成事件日志。 如何导出这些日志并将它们导入另一台计算机以通过 History Server UI 进行查看?
【问题讨论】:
-
AFAIK,Spark History Server 只读取转储在特定目录(例如 HDFS 上)的日志文件。无需“导出”任何东西。啊,还有,没有清除机制......你必须自己编写脚本。
-
我将日志文件存储在我的目录“/tmp/spark-events”中,但是当我将它们传输到另一台计算机并启动历史服务器时,日志不会出现在 Web 界面中。我想知道的是如何在另一台计算机的 Web 界面中显示日志。
标签: apache-spark logging import export rdd