【发布时间】:2019-04-15 18:07:21
【问题描述】:
由于尝试访问 kubernetes 内部服务时出错,我在某些节点上遇到了 CoreDNS 问题,处于 Crashloopback 状态。
这是一个使用 Kubespray 部署的新 K8s 集群,网络层是 Weave,在 Openstack 上使用 Kubernetes 版本 1.12.5。 我已经测试了与端点的连接,例如到达 10.2.70.14:6443 没有问题。 但是从 pod 到 10.233.0.1:443 的 telnet 失败了。
提前感谢您的帮助
kubectl describe svc kubernetes
Name: kubernetes
Namespace: default
Labels: component=apiserver
provider=kubernetes
Annotations: <none>
Selector: <none>
Type: ClusterIP
IP: 10.233.0.1
Port: https 443/TCP
TargetPort: 6443/TCP
Endpoints: 10.2.70.14:6443,10.2.70.18:6443,10.2.70.27:6443 + 2 more...
Session Affinity: None
Events: <none>
并且来自 CoreDNS 日志:
E0415 17:47:05.453762 1 reflector.go:205] github.com/coredns/coredns/plugin/kubernetes/controller.go:311: Failed to list *v1.Service: Get https://10.233.0.1:443/api/v1/services?limit=500&resourceVersion=0: dial tcp 10.233.0.1:443: connect: connection refused
E0415 17:47:05.456909 1 reflector.go:205] github.com/coredns/coredns/plugin/kubernetes/controller.go:313: Failed to list *v1.Endpoints: Get https://10.233.0.1:443/api/v1/endpoints?limit=500&resourceVersion=0: dial tcp 10.233.0.1:443: connect: connection refused
E0415 17:47:06.453258 1 reflector.go:205] github.com/coredns/coredns/plugin/kubernetes/controller.go:318: Failed to list *v1.Namespace: Get https://10.233.0.1:443/api/v1/namespaces?limit=500&resourceVersion=0: dial tcp 10.233.0.1:443: connect: connection refused
此外,从一个有问题的节点检查 kube-proxy 的日志发现以下错误:
I0415 19:14:32.162909 1 graceful_termination.go:160] Trying to delete rs: 10.233.0.1:443/TCP/10.2.70.36:6443
I0415 19:14:32.162979 1 graceful_termination.go:171] Not deleting, RS 10.233.0.1:443/TCP/10.2.70.36:6443: 1 ActiveConn, 0 InactiveConn
I0415 19:14:32.162989 1 graceful_termination.go:160] Trying to delete rs: 10.233.0.1:443/TCP/10.2.70.18:6443
I0415 19:14:32.163017 1 graceful_termination.go:171] Not deleting, RS 10.233.0.1:443/TCP/10.2.70.18:6443: 1 ActiveConn, 0 InactiveConn
E0415 19:14:32.215707 1 proxier.go:430] Failed to execute iptables-restore for nat: exit status 1 (iptables-restore: line 7 failed
)
【问题讨论】:
-
您能否通过
kubectl get pods -all-namespaces检查主服务器。请检查 coredns-pods 的状态。如果 STATUS 是 ContainerCreating 您可能必须删除它们,从而生成新的。 -
coredns 的状态是 Crashloopback,我的 Pod 都没有在 ContainerCreating 中
-
我也有同样的问题?你是怎么解决这个问题的?
-
知道了,添加我的解决方案作为答案
标签: kubernetes kubespray