【问题标题】:Service Fabric Cluster status "Upgrade service unreachable"Service Fabric 群集状态“升级服务无法访问”
【发布时间】:2017-10-30 15:28:00
【问题描述】:

我有由 3 个标准 A0 节点组成的 SF 集群。 我将集群扩展到 1 个节点,并明白这是个坏主意,因为在这种状态下没有任何工作(甚至 SF explorer 也没有工作) 然后我将其扩展回 3 个节点并重新启动主缩放器。 现在 scaleset 中的所有节点都已启动并正在运行,但 SF 集群状态为“升级服务无法访问”。 我看到了类似的问题Service Fabric Status: Upgrade service unreachable,建议将节点扩展到 D2,但这并没有解决我的问题。 我已经通过 RDP 连接到一个节点并且是一些事件日志:

EventLog -> 应用程序和服务日志 -> Microsoft Service Fabric -> 操作:

节点名称:_SSService_0 无法打开,升级域:0,故障域:fd:/0,地址:10.0.0.4,主机名:SSService000000,isSeedNode:true,versionInstance:5.6.210.9494:3,id:d9e8bae2d4d8116bfefb989b95e91f7b ,dca实例:131405546580494698,错误:FABRIC_E_TIMEOUT

EventLog -> 应用程序和服务日志 -> Microsoft Service Fabric -> 管理员:

client-10.0.0.4:19000/10.0.0.4:19000:错误 = 2147943625,失败计数 = 487。按 (type~Transport.St && ~"(?i)10.0.0.4:19000") 过滤以获得监听器生命周期。如果侦听器从未启动,或者侦听器/其进程在连接之前/期间停止,则预计连接失败。

【问题讨论】:

  • 据我回忆,唯一的解决方案(没有大量的闲逛)是销毁并重新创建集群!
  • 放大后遇到同样的错误。重新创建集群是不够的,因为现有的 VMSS 会抱怨不同的集群唯一标识符不匹配。很高兴它只是一个 azure 中的测试环境集群。

标签: azure azure-service-fabric


【解决方案1】:

如果您通过将 VM 规模集调整为 1 来缩小集群,那么您基本上是在破坏集群,因为它在设计上至少需要 3 个节点。因此,唯一的方法是从头开始重新创建它。

如果您需要一个仅包含 1 个节点的小型集群(例如用于测试目的),Azure 现在有一种方法可以创建一个单节点集群,但您将无法扩展它,因为它是一种特殊情况,不能用于生产。

【讨论】:

  • 如果我的集群中的 3 个虚拟机中有 2 个宕机了几分钟怎么办?你是说这会永远毁掉我的集群吗?
  • @Anubis Azure Service Fabric 需要至少 3 台计算机才能进行“正常”操作,因为您所做的一切都会被复制至少 3 次。也就是说,如果 1 个节点由于某种原因出现故障,您会收到集群运行状况错误事件,但是当它再次启动时,其他 2 个节点上有足够的数据来恢复故障节点。不能保证如果 2 个节点出现故障,第三个节点可以在它们再次启动时恢复集群,因此对于生产,我建议至少 5 个节点。
  • 我明白这一点。我不明白的是为什么当所有 3 个虚拟机都在运行时 mu 集群现在不工作。
  • 这个答案不正确。 Fabric 可以在 1 个节点上运行。
  • @l--''''''------'''''''''''' 没有。 1 节点集群是支付更少的“黑客”。这甚至不是任何类型的集群。
【解决方案2】:

升级服务不可达如果集群的活动虚拟机或节点的数量无论如何变为0,就会发生这种情况。就我而言,他是通过一次重新启动所有虚拟机而发生的。在这种状态下,节点可用且正在运行,但它们已与集群断开连接。

解决了这个问题,方法是从Virtual machine Scale set 解除分配并重新启动节点。

【讨论】:

    猜你喜欢
    • 2017-06-26
    • 1970-01-01
    • 2018-11-14
    • 2017-06-22
    • 2018-03-30
    • 2017-03-17
    • 2017-06-07
    • 2016-04-30
    • 2016-08-07
    相关资源
    最近更新 更多