【发布时间】:2015-11-08 19:07:55
【问题描述】:
我正在研究 Spark Streaming,并尝试监控和改进流媒体应用的性能。但我对以下问题感到困惑。
- Spark Portal 上“Spark Streaming”的每个阶段的含义是什么 应用程序。
- 并非所有“转换”都映射到任务。以及如何将“转换”定位到映射的任务。
流式代码快照:
val transformed = input.flatMap(i => processInput(i))
val aggregated = transformed.reduceByKeyAndWindow(reduce(_, _), Seconds(aggregateWindowSizeInSeconds), Seconds(slidingIntervalInSeconds))
val finalized = aggregated.mapValues(finalize(_))
finalized
(只有 Flatmap 阶段发生在门户上。)
Spark 流媒体门户
谢谢,
道
【问题讨论】:
标签: apache-spark spark-streaming