【发布时间】:2021-08-01 23:09:18
【问题描述】:
我正在运行一个包含 20 多个节点的 Kubernetes 集群。命名空间中的一个 pod 重新启动。 pod 因 OOM 而被杀死,退出代码为 137,并按预期再次重新启动。但是想知道之前运行 pod 的节点。我们可以在任何地方查看日志以获取信息?比如tiller、kubelet、kubeproxy等等……
【问题讨论】:
标签: kubernetes kubectl
我正在运行一个包含 20 多个节点的 Kubernetes 集群。命名空间中的一个 pod 重新启动。 pod 因 OOM 而被杀死,退出代码为 137,并按预期再次重新启动。但是想知道之前运行 pod 的节点。我们可以在任何地方查看日志以获取信息?比如tiller、kubelet、kubeproxy等等……
【问题讨论】:
标签: kubernetes kubectl
但想知道之前运行 pod 的节点。
如果一个 pod 被 ExitCode: 137 杀死,例如当它使用的内存超过其限制时,它将在同一个节点上重新启动 - 不会重新安排。为此,请检查您的指标或容器日志。
但是 Pods 也可能由于过度提交节点而被杀死,参见例如How to troubleshoot Kubernetes OOM and CPU Throttle.
【讨论】: