【发布时间】:2019-08-29 14:42:31
【问题描述】:
我在docker中有一个Flink集群(docker已经安装在三个不同的物理节点上);此外,相同的三个节点位于 Kafka 集群中。图片如下。我在主题的分区之间分配数据时遇到问题。
我的目标是在分区之间分配数据。我有两个选择:
编写一个简单的程序来分发数据。
使用 apache Nifi。
每个节点都有一个socket来接收数据,三个节点的数据流是一样的。
我的问题是,要在主题的分区之间分配数据,我必须在三个节点之一中使用 Apache NiFi(或简单程序)以防止分区中出现重复数据或在 Nifi 的每个节点中使用 Apache Nifi,本身,防止在分区中有重复的数据?
提前谢谢你。
【问题讨论】:
标签: apache-kafka apache-nifi flink-streaming