【问题标题】:AWS Cluster Autoscaler is not removing the nodesAWS Cluster Autoscaler 未删除节点
【发布时间】:2022-01-12 20:57:44
【问题描述】:

我在 AWS 中使用 autoscaler,我发现即使使用正确的 scale-down-utilization-threshold 值,我的节点也没有被删除。

以下是我的配置:

spec:
      containers:
      - command:
        - ./cluster-autoscaler
        - --cloud-provider=aws
        - --namespace=kube-system
        - --node-group-auto-discovery=asg:tag=k8s.io/cluster-autoscaler/enabled,k8s.io/cluster/mycluster123.us-west-2.dev
        - --expander=least-waste
        - --logtostderr=true
        - --scale-down-utilization-threshold=0.9
        - --scale-down-unneeded-time=1m
        - --scan-interval=10s
        - --skip-nodes-with-local-storage=false

即使在我将scale-down-utilization-threshold 调整到 0.9 (90%) 之后,节点仍在启动并运行,并且日志显示;

I1207 12:24:03.529223 scale down.go:785] 没有缩小的候选人 I1207 12:24:10.382036 reflector.go:384] k8s.10/client-go/informers/factory.go:134: Watch close - *v1.Service 共收到 0 个项目 I1207 12:24:13.542380 static_autoscaler.go: 192] 开始主循环 I1207 12:24:13.543224 filter_out_schedulable.go:65] 过滤掉调度 I1207 12:24:13.543436 filter_out_schedulable.go:130] 0 个其他标记为不可调度的 pod 可以被调度。 I1207 12:24:13.543592 filter_out_schedulable.go: 130] 0 个其他标记为不可调度的 pod 可以被调度 I1207 12:24:13.543708 filter_out_schedulable.go:90] 没有可调度的 pod I1207 12:24:13.543814 static_autoscaler.go:334] 没有不可调度的 pod I1207 12:24:13.543918 static_autoscaler.go:381] 计算不需要的节点 I1207 12:24:13.544044 1 前 filter processor.go:57] 跳过 ip-10-2-11-5.us-west-2.compute。内部的 没有节点组配置 I1207 12:24:13.544154 pre_filtering_processor.go:66] 跳过 ip-10-2-13-221.us-west-2。计算。内部 - 达到节点组最小大小 I1207 12:24:13.544245 前_ filter processor.go:66] 跳过 ip-10-2-19-220.us-west-2。计算。内部 - 达到节点组最小大小 I1207 12:24:13.544344 全国步枪协会 filter_processor.go:66] 跳过 ip-10-2-28-179.us-west-2。计算。内部的 = 达到最小父亲附近的节点 I1207 12:24:13.544433 预过滤 processor.go:57] 跳过 ip-10-2-27-105.us-west-2.compute。内部的 没有节点组配置 I1207 12:24:13.544741 static autoscaler.go:440] 缩减状态:unneededOnly=false lastScaleUpTime=2021-12-07 12:13:30.649716187 +0000 UTC m=+21.212580017 lastScaleDownDeleteTime=2021-12-07 12:13:30.649716287 +0 000 UTC m=+21.212580120 lastScaleDownFailTime=2021-12-07 12:13:30.649716378 +0000 UTC m=+21.212580208 scaleDownForbidden=false isDeleteInProgress=false scaleDownInCooldown=false I1207 12:24:13.544881 static autoscaler.go: 453] 开始缩减 I1207 12:24:13.545508 1 缩小。 go: 785] 没有缩小规模的候选人

节点的当前利用率约为 50%-60%,低于 scale-down-utilization-threshold 值的 90%

有人可以帮我解释为什么我无法驱逐节点吗?

【问题讨论】:

    标签: amazon-web-services kubernetes autoscaling


    【解决方案1】:

    从您注销后,它会告诉您已达到节点组的最小大小。

    node group min size reached

    如果将最小大小设置为 1,则集群只能缩减到您拥有的节点组数量。

    来自their documentation,您应该在命令中添加以下选项

    1. --balance-similar-node-groups
    2. --skip-nodes-with-system-pods=false

    【讨论】:

      猜你喜欢
      • 2021-12-30
      • 2022-07-21
      • 2019-08-24
      • 2018-12-31
      • 1970-01-01
      • 2020-09-29
      • 2021-06-01
      • 1970-01-01
      • 2020-01-15
      相关资源
      最近更新 更多