【发布时间】:2019-03-26 13:25:52
【问题描述】:
我有一个 Kafka Streams 应用程序,从一个具有 5 个分区的 Kafka 主题中读取数据。
然后将数据聚合/重新分区数次。
我试图在这个场景中找到推荐的线程数,但很难理解。 documentation 写道:
您可以启动与输入一样多的应用程序线程 Kafka 主题分区
这意味着在我的情况下 5 个线程是最大有效线程数。
但是,this blog 声称重新分区会使最大有效线程数翻倍:
...这个主题是自动创建的 分区数作为源主题,这意味着我们的应用程序是 现在从 8 个线程的 16 个分区中读取,从而创建了某种 争论。
这对我来说也是合理的,因为 Kafka Streams 也必须读取它创建的内部主题。
那么,有效线程的最大数量是 5 个分区,还是 5*(repartitions)?
【问题讨论】:
标签: apache-kafka apache-kafka-streams