【发布时间】:2020-09-29 12:01:02
【问题描述】:
假设我们有一个包含 2 个分区的主题,并且有“n”个生产者正在为该主题生成数据。现在,数百万条 MessageRecord 分布在 2 个分区中。
假设,我们有 2 个线程(即 2 个单独的实例)为流处理器供电。现在,在此设置中,假设 Thread-1(即 Streaming Task-1)获得了 Partition P-1,并说 Thread-2(即 Streaming Task-2)获得了 Partition P-2 进行处理!
ASK 是:- 比如说,我们想知道,到目前为止,Streaming-Task-1 已经处理了多少MessageRecords,或者说是 9 月 28 日,2KK?我该怎么做?
而且,更大的问题是:“Streaming-Task-1”永远不会知道正在处理的MessageRecords 的总计数,它只会知道自己处理的计数!!
它能知道它知道另一个 Task-2 处理的计数吗??
【问题讨论】:
标签: apache-kafka kafka-consumer-api apache-kafka-streams confluent-platform