【发布时间】:2016-06-17 07:26:56
【问题描述】:
高级消费者 API 似乎一次读取一条消息。
如果消费者想要处理这些消息并将其提交给 Solr 或 Elastic-Search 等其他下游消费者,这对于消费者来说可能会很成问题,因为他们更喜欢批量接收消息而不是一次接收一条消息。
在内存中批处理这些消息也不是一件容易的事,因为只有当批处理已经提交时,Kafka 中的偏移量也需要同步,否则带有未提交下游消息(如在 Solr 或 ES 中)的崩溃 kafka-consumer 将它的偏移量已经更新,因此消息松散。
如果消费者在向下游提交消息之后但在更新消息偏移量之前崩溃,它可能会多次使用消息。
如果 Kafka 批量消费消息,那么一些指向代码/文档的指针将不胜感激。
谢谢!
【问题讨论】:
-
您要的是什么版本的 Kafka?我假设如果您谈论的是高级消费者,它是 0.8.2 或之前的版本。
标签: apache-kafka