【问题标题】:Zooker Failover StrategiesZooker 故障转移策略
【发布时间】:2014-11-01 06:35:09
【问题描述】:

我们是使用 Storm 和 Kafka 构建应用程序的年轻团队。 我们有一个由 Storm 和 Kafka 使用的 3 个节点的共同 Zookeeper 集合。

我写了一个测试用例来测试 zooker Failovers

1) 检查所有三个节点是否都在运行,并确认其中一个被选为 Leader。

2) 使用 Zookeeper unix 客户端,创建一个 znode 并设置一个值。验证这些值是否反映在其他节点上。

3) 修改znode。在一个节点中设置值并验证其他节点是否反映了更改。

4) 杀死其中一个工作节点并确保主/领导者收到有关崩溃的通知。

5) 杀死领导节点。验证在其他两个节点中,一个被选为领导者。

我还需要添加更多测试用例吗?其他想法/建议/要添加的指针?

【问题讨论】:

  • 您有遇到的具体问题吗?您现在的问题无法得到明确回答,因此您可能无法得到您想要的答复。
  • 也是zookerzookeeper的缩写????

标签: apache-zookeeper apache-storm apache-kafka


【解决方案1】:

来自documentation
验证自动故障转移

设置自动故障转移后,您应该测试其操作。为此,首先找到活动的 NameNode。您可以通过访问 NameNode Web 界面来判断哪个节点处于活动状态——每个节点都会在页面顶部报告其 HA 状态。

找到活动的 NameNode 后,您可能会导致该节点出现故障。例如,您可以使用 kill -9 来模拟 JVM 崩溃。或者,您可以重新启动机器或拔下其网络接口以模拟不同类型的中断。在触发您希望测试的中断后,另一个 NameNode 应该会在几秒钟内自动变为活动状态。检测故障和触发故障转移所需的时间取决于 ha.zookeeper.session-timeout.ms 的配置,但默认为 5 秒。

如果测试不成功,则可能是配置错误。检查 zkfc 守护进程和 NameNode 守护进程的日志,以便进一步诊断问题。

more on setting up automatic failover

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-02-02
    • 2018-12-28
    • 2019-03-26
    • 1970-01-01
    • 2021-07-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多