【问题标题】:Spark Streaming - Jobs run concurrently with default spark.streaming.concurrentJobs settingSpark Streaming - 作业与默认 spark.streaming.concurrentJobs 设置同时运行
【发布时间】:2017-06-12 23:02:13
【问题描述】:

我在 Spark Streaming Job 中遇到了一个奇怪的行为。 我们使用 spark.streaming.concurrentJobs 的默认值,即 1。 相同的流作业正常运行了一天以上,批处理间隔设置为 10 分钟。 突然间,同一个作业开始同时运行所有进入的批次,而没有将它们放入队列中。

以前有人遇到过这种情况吗? 这会很有帮助!

【问题讨论】:

  • 10 分钟间隔是否足以完成单个作业?完成一项工作需要多少时间。
  • 是的!一项工作在 5 到 6 分钟内完成。即使没有,其他作业也只能处于 QUEUED 状态,而不是 PROCESSING 状态。
  • 您是否在 YARN 上运行 Spark 作业?

标签: apache-spark spark-streaming


【解决方案1】:

这种行为似乎很奇怪,但我相信似乎发生在一次只运行一个作业并且如果批处理时间

Spark Streaming 创建者 Tathagata hs 提到了这一点:How jobs are assigned to executors in Spark Streaming?

【讨论】:

    猜你喜欢
    • 2021-11-17
    • 2017-04-02
    • 1970-01-01
    • 2016-08-31
    • 1970-01-01
    • 2018-10-26
    • 1970-01-01
    • 2018-09-28
    • 2017-06-19
    相关资源
    最近更新 更多