【发布时间】:2020-04-07 08:57:41
【问题描述】:
我正在设计一个基于 Kafka 的系统,用于从通常网络连接不佳的远程平台传递消息。 Kafka 集群将运行在一个舒适的数据中心,所有节点都不太可能出现故障。让我担心的是生产者在网络中断期间的行为(这肯定会发生并且可以持续数天)。这是基于 Kafka 的系统尚未实现的主要原因,即所有数据都被认为是关键的,应该有 0 数据丢失。目前我们有一个使用 TCP 连接的简单系统,如果不可用,将数据缓冲到 HDD(让我们考虑有足够的空间来缓冲数据)。
有没有人有在网络中断期间将数据用于 HDD 缓冲的经验?这会对 Kafka 集群产生负面影响吗?将有数百个供应商,几乎可以保证其中一些供应商在任何给定时间都会中断。
感谢您的帮助!
【问题讨论】:
-
生产者会在broker外缓冲,如果缓冲区正在构建时没有收到流量,为什么会影响它们?
标签: networking apache-kafka buffering producer