【发布时间】:2019-03-31 21:30:05
【问题描述】:
我有一个应用程序需要从 Kafka 队列中消费,以维护每个主题的批处理顺序。我为每个主题创建了不同的 DStream。但是当我运行它时,每个主题都是按顺序使用的。如果我设置“spark.streaming.concurrentJob=4”(n>1),那么主题是并行使用的,但在相同的主题批次内也并行处理。 (我需要避免) 有没有一种方法可以并行处理不同的 DStream,并在一个 DStream 中线性处理作业。
【问题讨论】: