【发布时间】:2022-01-05 12:05:34
【问题描述】:
我使用 3 个服务器集群进行 Kafka 配置,使用 Snowflake 连接器 REST API 将数据推送到 Snowflake 数据库:所有这些都是在 AWS 上运行的 3 个不同的虚拟机
1.这里,我们需要3个kafka单独的服务器zookeeper-services需要在集群中启动并运行,否则只有1个就足够了,好像需要在所有3个服务器zookeeper服务中执行,是否需要不同的端口配置,例如:
1.a:zookeeper.connect=xx.xx.xx.xxx:2181, xx.xx.xx.xxx:2182, xx.xx.xx.xxx:2183 否则应该在所有 servers.properties 文件中为 2181
1.b:PLAINTEXT://localhost:9091 in server1, PLAINTEXT://localhost:9092 and PLAINTEXT://localhost:9093 (即使在此它应该是 localhost else IP 地址) 需要给出吗?
1.c:server.1=
1.d:Clientport=2181 需要在所有 3 个 VM 中的服务中相同,否则它需要不同?
1.e:每个服务器上的 listeners = PLAINTEXT://your.host.name:9092 是否应该有单独的 port 之类的 VM-Server1:9092、VM-Server2:9093、VM-Server3:9094。否则,主服务器 IP 应在服务器 2 和服务器 3 的工作节点中给出,否则该工作节点自己的服务器 IP
-
关于配置项 "tasks.max":"1" 的 REST-API 的连接器配置应该是什么。因为我要为 Kafka 使用 3 个服务器集群,并且将在所有 3 台机器上启动 3 个 distribute-connector
-
我得到重复,如果我在第二台服务器中启动分布式连接器的服务,如何避免这些重复记录。但是是的,如果它只有 1 个分布式连接器正在运行服务,那么就没有重复。请提出建议,因为如果只有 1 个分布式连接器服务启动并运行,则延迟会增加。
-
创建 /data/zookeeper/myid 文件,并为 zookeeper1 赋值 1,为 zookeeper2 赋值 2,为 zookeeper3 赋值 3。当您在不同的 VM 中时是否需要这样做?
-
分布式连接器服务一旦开始执行一段时间,然后就会断开连接
-
需要遵循的 3 服务器集群架构和最佳实践的任何其他参数
【问题讨论】:
标签: apache-kafka apache-zookeeper apache-kafka-connect