【发布时间】:2017-04-28 01:00:54
【问题描述】:
我有一个 kafka 集群,其中包含三个代理和一个主题,复制因子为三个和三个分区。我可以看到每个代理都有一个相同大小的所有分区的日志副本。该主题有两个制作人。
有一天,我将一位制作人的写作量减少了一半。然后我发现三个broker的入站流量都减少了,这是意料之中的,但是只有分区1的leader节点的出流量减少了,我不明白。
分区领导者的出站流量因复制而减少。但是每个broker都是一个partition的leader,为什么只有一个leader的outbound流量减少了呢?生产者是否可能只将内容写入一个分区?虽然我不这么认为。
【问题讨论】:
-
视情况而定。您能否检查每个分区的偏移量以查看您是否均匀地生成消息?
-
感谢您的提醒。我检查了所有三个分区的日志大小。实际上,它们的产生并不均匀。这很有趣。不平衡很大,例如 1:6。可能是因为 ravthiru 提到的,删除特定键会导致特定分区没有数据。
标签: hadoop apache-kafka kafka-producer-api