【发布时间】:2021-05-18 05:01:35
【问题描述】:
我最近将我的 AKS 群集从 1.16.x 升级到 1.18.17(这是两个版本的跳跃)。我使用 Azure 门户而不是 CLI 进行了升级。
升级本身已经成功,我可以看到我的集群现在是 1.18.17 版本,乍一看,一切似乎都按预期工作,但在概览面板的顶部,会显示以下消息:
此容器服务处于失败状态。点击这里去诊断和解决问题。
由于集群处于此状态,我无法扩展或升级,因为我收到一条错误消息,告诉我在集群升级或处于失败状态时操作不可用。
错误链接到的支持页面没有给我任何有用的信息。它甚至没有提到我的集群处于故障状态的事实。
当我接近我们的 VM 计算配额限制时,我曾经看到过这个错误。不过目前,我只使用了 10%,而且我没有足够的 pod 和节点来推动它。唯一达到最大值的其他配额是网络观察者,我认为这无关。
扩容操作链接到这个支持文档:aka.ms/aks-cluster-failed,里面有关于配额大小的建议,我已经试过了。
我真的为这个问题摸不着头脑,我找不到任何有用的支持文档、博客文章或其他问题,因此我们将不胜感激!
【问题讨论】:
标签: azure kubernetes azure-aks