【发布时间】:2021-02-19 10:30:04
【问题描述】:
我正在 EKS 集群中运行需要大量内存的 pod。如果 pod 有错误状态或 OOMKilled 错误,我希望节点以某种方式缩小但捕获错误。这可能吗?截至目前,我必须手动删除自动缩放组的 pod 以触发节点被删除。
【问题讨论】:
-
AFAIK 无法根据 kubernetes pod 状态缩减节点。关于自动缩放器如何工作的简短description。所以我想说你应该在你的 pod 中解决错误/oomkilled 的问题,除非它是故意的。你需要多久杀死一次这个 pod?也许你可以每隔一段时间使用 cronjob 来杀死这个 pod?有一个 example 有这样的 cronjob。
标签: kubernetes