【问题标题】:Kubernetes Pod with Error Status Stuck Terminating错误状态卡住的 Kubernetes Pod 正在终止
【发布时间】:2017-07-31 23:21:58
【问题描述】:

我有一个由 Stateful Set 创建的 Kubernetes Pod(不确定这是否重要)。这个 pod 中有两个容器。当两个容器之一发生故障并使用get pods 命令时,1/2 容器处于就绪状态,状态为“错误”。第二个容器从不尝试重新启动,我无法销毁 pod,除非使用 --grace-period=0 --force 标志。典型的删除使 pod 永远或很长时间处于“终止”状态。什么可能导致这种行为以及如何进行调试?

【问题讨论】:

    标签: docker kubernetes


    【解决方案1】:

    我在我的 k8s 1.6 集群 esp 的一个节点上遇到了类似的问题。当节点已经运行了几个星期时。它可能发生在任何节点上。发生这种情况时,我在节点上重新启动 kubelet,错误就消失了。

    这不是最好的做法,但它总能解决问题。如果您重新启动 kubelet 也不会对集群造成损害,因为正在运行的 pod 会继续保持运行。

    kubectl get po -o wide 可能会告诉您错误的 pod 正在一个节点上运行。 SSH 到该节点并重新启动 kubelet。

    【讨论】:

    • 我们不得不反弹 kubelet 和偶尔的 docker(这非常痛苦);围绕该主题有plenty of issues,但issue 48866 是最接近我们在CoreOS 上使用1.6 的经验(使用楔形安装和大量“孤立吊舱”消息)
    猜你喜欢
    • 2019-09-19
    • 2019-01-04
    • 1970-01-01
    • 2021-11-22
    • 1970-01-01
    • 2018-06-25
    • 2020-09-21
    • 1970-01-01
    • 2020-03-16
    相关资源
    最近更新 更多