【问题标题】:How to recovery cluster when all nodes down?当所有节点都关闭时如何恢复集群?
【发布时间】:2017-11-30 08:12:28
【问题描述】:
如果 3 节点 Percona 集群中的所有节点都已关闭(正常关闭或崩溃),来自 this blog,它表示当节点可以相互连接时,集群可以自动恢复。但是,在这种情况下启动节点似乎是一项艰巨的任务。
那么在这种情况下是否有可靠且可操作的方法来进行集群恢复呢?
【问题讨论】:
-
你能用版本和操作系统信息更新这个还是这个问题是故意笼统的? Percona 网站上提供了更多信息,例如此页面link,但可能存在依赖关系。
标签:
mysql
percona
percona-xtradb-cluster
【解决方案1】:
检查所有 3 个节点上的 grastate.dat 文件。哪个节点的序列号最高?您应该引导该节点。等待它上线。然后启动node2。它应该来自引导节点的 IST。然后启动node3。
黄金法则:您必须始终引导任何集群的第一个节点。自举不会擦除数据;它只会启动一个新集群。
根据版本不同,您可能需要手动将 grastate 文件中的safe_to_bootstrap 设置为 1。
【解决方案2】:
另一件事您可以尝试检查哪个是最高级的节点
在每个节点上运行以下命令并检查哪个节点具有最大的已提交事务值。
mysqld_safe --wsrep-recover
启动第一个具有最大承诺值的节点,然后是第二个和第三个