【问题标题】:Configure kubernetes node to scale down if pods are in Error/OOMKilled state如果 pod 处于 Error/OOMKilled 状态,则将 kubernetes 节点配置为缩减
【发布时间】:2021-02-19 10:30:04
【问题描述】:

我正在 EKS 集群中运行需要大量内存的 pod。如果 pod 有错误状态或 OOMKilled 错误,我希望节点以某种方式缩小但捕获错误。这可能吗?截至目前,我必须手动删除自动缩放组的 pod 以触发节点被删除。

【问题讨论】:

  • AFAIK 无法根据 kubernetes pod 状态缩减节点。关于自动缩放器如何工作的简短description。所以我想说你应该在你的 pod 中解决错误/oomkilled 的问题,除非它是故意的。你需要多久杀死一次这个 pod?也许你可以每隔一段时间使用 cronjob 来杀死这个 pod?有一个 example 有这样的 cronjob。

标签: kubernetes


【解决方案1】:

你可以使用像 liveliness 和 rediness probs 这样的探针

更多详情@https://kubernetes.io/docs/tasks/configure-pod-container/configure-liveness-readiness-startup-probes/

【讨论】:

    猜你喜欢
    • 2018-12-07
    • 1970-01-01
    • 2018-10-11
    • 2018-02-28
    • 2022-10-26
    • 1970-01-01
    • 1970-01-01
    • 2017-12-29
    • 2020-07-09
    相关资源
    最近更新 更多