【问题标题】:Azure AKS - This container service is in a failed stateAzure AKS - 此容器服务处于失败状态
【发布时间】:2021-05-18 05:01:35
【问题描述】:

我最近将我的 AKS 群集从 1.16.x 升级到 1.18.17(这是两个版本的跳跃)。我使用 Azure 门户而不是 CLI 进行了升级。

升级本身已经成功,我可以看到我的集群现在是 1.18.17 版本,乍一看,一切似乎都按预期工作,但在概览面板的顶部,会显示以下消息:

此容器服务处于失败状态。点击这里去诊断和解决问题。

由于集群处于此状态,我无法扩展或升级,因为我收到一条错误消息,告诉我在集群升级或处于失败状态时操作不可用。

错误链接到的支持页面没有给我任何有用的信息。它甚至没有提到我的集群处于故障状态的事实。

当我接近我们的 VM 计算配额限制时,我曾经看到过这个错误。不过目前,我只使用了 10%,而且我没有足够的 pod 和节点来推动它。唯一达到最大值的其他配额是网络观察者,我认为这无关。

扩容操作链接到这个支持文档:aka.ms/aks-cluster-failed,里面有关于配额大小的建议,我已经试过了。

我真的为这个问题摸不着头脑,我找不到任何有用的支持文档、博客文章或其他问题,因此我们将不胜感激!

【问题讨论】:

    标签: azure kubernetes azure-aks


    【解决方案1】:

    回答我自己的问题,希望它可以帮助其他人,或者将来帮助我自己。

    我设法通过使用 azure cli Upgrade an Azure Kubernetes Service (AKS) cluster 运行更新来获取有关错误的更多信息。

    您还可以使用 cli 检查可用的更新。 Check for available AKS cluster upgrades.

    在进行故障排除时,使用 cli 似乎会提供更多信息。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2022-06-30
      相关资源
      最近更新 更多