【发布时间】:2022-01-02 20:20:54
【问题描述】:
我是初学者 kafka 和 flink 爱好者。 我注意到一些令人不安的事情。当我将 kafka 作业的并行度增加到超过 1 时,我没有窗口来执行它们的进程。我希望使用并行性来提高分析速度。
查看来自 Apache Flink Web Dashboard 的图像示例,该示例将问题可视化。 这是完全相同的代码和完全相同的摄取数据集,区别仅在于并行度。在第一个示例中,摄取的数据流经窗口函数,但是当并行度增加时,数据只会堆积在第一个从不执行的窗口函数中。它永远保持这种状态,永远不会产生任何错误。
代码中使用的源是 KafkaSource,FlinkKafkaConsumer 似乎在相同的设置下工作正常,但已被弃用,所以我不想使用它。
感谢您的任何想法!
【问题讨论】:
标签: apache-kafka apache-flink flink-streaming