【发布时间】:2019-06-04 01:10:29
【问题描述】:
我们在 GKE 中创建了一个集群。它运行良好,但 Kube-dns 在凌晨 12:00 自动重启,同时还有几个 pod。命名空间 kube-system 中有 2 个 kube-dns pod,但只有一个重新启动并出现 https://i.stack.imgur.com/S500G.png 错误。我们还注意到其他 pod 没有受到影响。
kubectl 版本:
Client Version: version.Info{Major:"1", Minor:"14", GitVersion:"v1.14.2", GitCommit:"66049e3b21efe110454d67df4fa62b08ea79a19b", GitTreeState:"clean", BuildDate:"2019-05-16T16:23:09Z", GoVersion:"go1.12.5", Compiler:"gc", Platform:"linux/amd64"}
Server Version: version.Info{Major:"1", Minor:"13+", GitVersion:"v1.13.5-gke.10", GitCommit:"f5949b3427099d4e410ef96d6e0fea3cd4794e10", GitTreeState:"clean", BuildDate:"2019-04-10T19:05:37Z", GoVersion:"go1.11.5b4", Compiler:"gc", Platform:"linux/amd64"}
日志sn-p:
https://i.stack.imgur.com/S500G.png
我们预计它会卡住并需要手动重启,但它与其他 pod 一起在凌晨 12:00 自动重启。这怎么可能在 GKE 中自动恢复 kube-dns?
【问题讨论】:
-
1) 请将日志复制为文本,而不是截图;我从未见过无法复制文本的终端模拟器,所以就这样做吧。 2) 包括 Kubernetes 对 Pod 的看法,即每个 Pod 的
kubectl -owide get pods和kubectl describe pod <pod-name>的输出(然后可能会要求您提供更多信息,但这应该是开始)。
标签: kubernetes gcloud kube-dns google-cloud-dns