【问题标题】:Is it possible to get the details of the node where the pod ran before restart?是否可以在重新启动之前获取 pod 运行的节点的详细信息?
【发布时间】:2021-08-01 23:09:18
【问题描述】:

我正在运行一个包含 20 多个节点的 Kubernetes 集群。命名空间中的一个 pod 重新启动。 pod 因 OOM 而被杀死,退出代码为 137,并按预期再次重新启动。但是想知道之前运行 pod 的节点。我们可以在任何地方查看日志以获取信息?比如tiller、kubelet、kubeproxy等等……

【问题讨论】:

    标签: kubernetes kubectl


    【解决方案1】:

    但想知道之前运行 pod 的节点。

    如果一个 pod 被 ExitCode: 137 杀死,例如当它使用的内存超过其限制时,它将在同一个节点上重新启动 - 不会重新安排。为此,请检查您的指标或容器日志。

    但是 Pods 也可能由于过度提交节点而被杀死,参见例如How to troubleshoot Kubernetes OOM and CPU Throttle.

    【讨论】:

    • 谢谢乔纳斯。就我而言,我看到只有 2 个节点已经达到内存资源限制。即)应用于节点的限制超过了分配的限制。此外,pod 运行/运行的节点在节点容量内仍然有限制。如果它被杀死了,那么我认为 pod 被重新安排到另一个节点上?退出代码 137 表示系统终止了容器。这里的系统是指实际的节点或任何其他 kube-component?
    • Exit Code 137 表示容器被Linux进程杀死,medium.com/tailwinds-navigator/…
    • 好的。在我的情况下,它在同一个节点上重新启动,因为它是 OOM。谢谢乔纳斯。
    猜你喜欢
    • 1970-01-01
    • 2014-07-18
    • 2012-03-23
    • 1970-01-01
    • 1970-01-01
    • 2016-09-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多