【发布时间】:2019-03-18 14:49:36
【问题描述】:
我通过 kubeadm 部署了一个 v1.11 kube-cluster,具有一个主节点和三个节点。
我的 kube-controller pod 经常记录:
E1012 08:17:42.897796 node_lifecycle_controller.go:889] 错误 更新节点izwz95wx4ufpnolro1iekmz:操作无法完成 节点“izwz95wx4ufpnolro1iekmz”:对象已被修改;请 将您的更改应用到最新版本,然后重试
“izwz95wx4ufpnolro1iekmz”节点将定期处于 NotReady 状态,并且 kubectl describe node 不提供任何有用信息,仅提供 NotReady 状态。
如何调试我的集群并找出根本原因?
【问题讨论】:
-
您是否在其他工作节点上观察到了同样的问题?您是否已在主节点上启动并运行所有
kube-system运行时组件?描述了here的集群的一般故障排除操作。 -
@mk_sta 这个问题有时会在重启有问题的节点后转向其他woker节点。所以看来这个问题会出现在所有的woker节点上,我不知道是什么导致的。应该在主节点上的所有组件都已启动。顺便说一句,我有一个woker节点,它的版本是1.13,其他的都是1.11,包括主节点。
-
您是否考虑过在主节点上应用相同的 Kubernetes 版本并将此工作节点重新加入集群?
-
@mk_sta 我试过删除节点,但是没有用。
-
检查受影响节点上的
kubelet日志,并在 API 服务器日志中查找任何相关事件。
标签: kubernetes