【问题标题】:GKE's cluster autoscaler got stucked in initializing statusGKE 集群自动扩缩器陷入初始化状态
【发布时间】:2020-04-29 14:52:51
【问题描述】:

我最近在优化集群 (GKE) 利用率,两天前我注意到我的节点没有扩大或缩小。自动缩放配置映射处于初始化模式:

kubectl describe -n kube-system configmap cluster-autoscaler-status
Name:         cluster-autoscaler-status
Namespace:    kube-system
Labels:       <none>
Annotations:  cluster-autoscaler.kubernetes.io/last-updated: 2020-04-29 14:44:54.363091383 +0000 UTC

Data
====
status:
----
Cluster-autoscaler status at 2020-04-29 14:44:54.363091383 +0000 UTC:
Initializing
Events:  <none>

其他集群包含适当的自动缩放事件。我认为我可以用 pod 的数量使集群过载。它包含约 100 个 Pod/节点。

更新 1:

  1. master 上运行的 GKE 版本是什么?: 1.14.10-gke.27,但我认为升级到 1.15.11-gke.9 会有所帮助(并且会以某种方式掌握)。它没有帮助。我们还有其他具有相同版本和池的集群。
  2. 是发生在任何节点池上还是发生在特定的节点池上?: 自动缩放配置映射是一种“全局级别”,因此所有节点池都会受到影响。
  3. 能否提供池大小、gke 版本和自动缩放设置?
default  OK 1.14.10-gke.27  4 (2 per zone) custom-8-45056   Container-Optimized OS (cos)    0 - 8 nodes per zone    
preemptible8-2   OK 1.14.10-gke.27  10 (5 per zone) n1-standard-8   Container-Optimized OS (cos)    0 - 20 nodes per zone   
scalability-stable-2-cpu     OK 1.14.10-gke.27 1 (0 - 1 per zone) n1-standard-2 Container-Optimized OS (cos)    0 - 4 nodes per zone

附加信息:

  1. 当它关闭自动缩放并在每个节点池中打开时,kubectl describe -n kube-system configmap cluster-autoscaler-status has changed 的输出。
  2. 我认为在更改以下设置时可能会发生这种情况:scalability-stable-2-cpu。

【问题讨论】:

  • 你的k8s版本是多少?在它发生之前你是否执行了一些操作?另外,node pools和master是同一个k8s版本?
  • @KoopaKiller 我发布了一些更新。

标签: kubernetes google-kubernetes-engine autoscaling


【解决方案1】:

3天后恢复正常。

【讨论】:

    猜你喜欢
    • 2018-05-13
    • 2017-09-20
    • 2017-01-20
    • 2021-02-16
    • 2021-04-10
    • 2020-09-24
    • 2021-11-21
    • 2019-04-05
    • 2023-01-26
    相关资源
    最近更新 更多