【问题标题】:MongoDB Cluster Shard with no primary and only one secondary activeMongoDB 集群分片,没有主,只有一个辅助活动
【发布时间】:2019-12-06 15:59:51
【问题描述】:

我的 MongoDB Sharded Cluster 有 3 个分片,每个分片在 3 个副本上运行。总结一下:

Config Server:
  shardcfg1.server.com:27018
  shardcfg2.server.com:27018
  shardcfg3.server.com:27018
Shard1:
  shard11.server.com:27000 (P)
  shard12.server.com:27000 (S)
  shard13.server.com:27000 (S)
Shard2:
  shard21.server.com:27000 (S)
  shard22.server.com:27000 (STARTUP)
  shard23.server.com:27000 (Unhealthy - invalidReplicaSetConfig: Our replica set configuration is invalid or does not include us)
Shard3:
  shard31.server.com:27000 (S)
  shard32.server.com:27000 (P)
  shard33.server.com:27000 (S)

如果您看到上述状态,则问题出在SHARD2

  • SHARD2 中没有主节点
  • 副本集配置如何将shard23.server.com 标记为非成员

辅助shard21.server.com 可用于获取转储,因此可能不会丢失数据。但是,我对如何再次稳定集群一无所知?

如何从集群中完全删除 SHARD2?或者我应该如何再次使用相同的服务器重新初始化分片?

【问题讨论】:

  • 每个分片都是一个副本集。除非您确认块已迁移到另一个分片,否则不要尝试从集群中删除分片。假设您有有效的备份,您可以尝试在不从备份恢复的情况下设置和运行 shard2 副本。日志文件应该揭示为什么 shard22.server.com 是 STARTUP 并且没有促进领导选举。 3 台服务器中的 2 台是多数,预计领导选举。 shard23 可能需要从 shard2 副本集中移除并重新添加,从而导致初始同步,从而恢复为 PSS 模型。
  • 如果跨副本集应用不一致的配置更改,可能会出现副本集初始化问题。例如,如果副本集是在没有内部身份验证的情况下创建的,那么一个成员应用了密钥文件身份验证,它将出现问题。验证副本集的配置一致性。尝试单独连接到每个成员以验证连接是否可行。
  • @barrypicker 我猜如果我们删除分片,排空过程就是在重新排列的范围内迁移块。如果我错了,请纠正我,因为如果我错了,我在集群中所做的事情太可怕了!

标签: mongodb mongodb-replica-set mongodb-cluster mongodb-replica


【解决方案1】:

我错过的一个小细节后来成为解决方案的关键:集群由 Mongo-MMS 管理!

解决方案:

所以我有一个辅助服务器,另一个处于 STARTUP 模式的服务器和第三个可笑地宣称自己不属于副本集的服务器!整个集群由 MMS 管理。我确实关闭了所有三台服务器。现在我只是简单地启动了独立模式下可用的辅助来获取整个数据库的备份。

在此期间,我从集群中删除了这个分片,因为分片中没有主分片,所以排水卡住了。然而,一件奇怪的事情发生了,这些服务器上的自动化代理被删除了。备份完成后,我启动了备用服务器的mongod,该服务器上有数据。 遗憾的是,终端确实显示了 SECONDARY,但是当我检查 rs.status() 时,它显示了三个服务器,我确实记得拼接了一个流氓服务器。就在那时让我印象深刻的是,MMS 正在管理这些副本集的配置。

删除恶意服务器后,我迅速将强制标志重新配置为 true。所以现在我有两台服务器,一台在辅助服务器,另一台在启动模式。重新配置后几秒钟!瞧!二级将自己提升为一级。

一场漫长的战斗,但很高兴地说永远不需要恢复备份或重做整个分片!

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-12-04
    • 1970-01-01
    相关资源
    最近更新 更多