【发布时间】:2019-12-17 11:11:37
【问题描述】:
由于某种原因,通过 kops(版本 1.13.0)从 kubernetes 1.11.9 升级到 1.12.9 后,我的主节点无法再连接到我的集群。在清单中,我将 kubernetesVersion 从 1.11.9 -> 1.12.9 升级。这是我正在做的唯一改变。但是,当我运行 kops rolling-update cluster --yes 时,出现以下错误:
Cluster did not pass validation, will try again in "30s" until duration "5m0s" expires: machine "i-01234567" has not yet joined cluster.
Cluster did not validate within 5m0s
之后,如果我运行 kubectl get nodes,我将不再在集群中看到该主节点。
通过 ssh 到断开连接的主节点实例进行一些调试,我通过运行 sudo cat /var/log/kube-apiserver.log 在我的 api-server 日志中发现了以下错误:
controller.go:135] Unable to perform initial IP allocation check: unable to refresh the service IP block: client: etcd cluster is unavailable or misconfigured; error #0: dial tcp 127.0.0.1:4001: connect: connection refused
我怀疑这个问题可能与 etcd 有关,因为当我运行 sudo netstat -nap | grep LISTEN | grep etcd 时没有输出。
有人知道如何让我的主节点回到集群中,或者对尝试的事情有什么建议吗?
【问题讨论】:
标签: linux amazon-web-services kubernetes etcd kops