【发布时间】:2016-05-07 06:10:22
【问题描述】:
我目前正在对我的 Spark Streaming 应用程序执行性能测试。 一般来说,我通过套接字连接接收 JSON 消息,每秒一条消息。 然后我使用 Spark Streaming 方法将消息作为 RDD 处理,最后将生成的 RDD 打印到数据库中。
这是我的问题:每当我想检查块处理时间或调度延迟等时,我需要转到端口 4040 上的 Spark UI。
不过,我想做的是在程序运行时使用这些值创建一个 Log,并将其作为 txt 文件存储在某个目录中。
现在我知道,有了 SparkContext,我可以使用 addSparkListener 方法或 Logger。
如何为 Spark Streaming 上下文执行此操作?
非常感谢,如果我感到困惑,请道歉。
【问题讨论】:
标签: apache-spark performance-testing spark-streaming