【发布时间】:2017-10-30 15:28:00
【问题描述】:
我有由 3 个标准 A0 节点组成的 SF 集群。 我将集群扩展到 1 个节点,并明白这是个坏主意,因为在这种状态下没有任何工作(甚至 SF explorer 也没有工作) 然后我将其扩展回 3 个节点并重新启动主缩放器。 现在 scaleset 中的所有节点都已启动并正在运行,但 SF 集群状态为“升级服务无法访问”。 我看到了类似的问题Service Fabric Status: Upgrade service unreachable,建议将节点扩展到 D2,但这并没有解决我的问题。 我已经通过 RDP 连接到一个节点并且是一些事件日志:
EventLog -> 应用程序和服务日志 -> Microsoft Service Fabric -> 操作:
节点名称:_SSService_0 无法打开,升级域:0,故障域:fd:/0,地址:10.0.0.4,主机名:SSService000000,isSeedNode:true,versionInstance:5.6.210.9494:3,id:d9e8bae2d4d8116bfefb989b95e91f7b ,dca实例:131405546580494698,错误:FABRIC_E_TIMEOUT
EventLog -> 应用程序和服务日志 -> Microsoft Service Fabric -> 管理员:
client-10.0.0.4:19000/10.0.0.4:19000:错误 = 2147943625,失败计数 = 487。按 (type~Transport.St && ~"(?i)10.0.0.4:19000") 过滤以获得监听器生命周期。如果侦听器从未启动,或者侦听器/其进程在连接之前/期间停止,则预计连接失败。
【问题讨论】:
-
据我回忆,唯一的解决方案(没有大量的闲逛)是销毁并重新创建集群!
-
放大后遇到同样的错误。重新创建集群是不够的,因为现有的 VMSS 会抱怨不同的集群唯一标识符不匹配。很高兴它只是一个 azure 中的测试环境集群。
标签: azure azure-service-fabric