【发布时间】:2019-12-02 18:55:55
【问题描述】:
我有一个 Azure Kubernetes 集群,所有 pod 和服务都处于运行状态。我遇到的问题是,当我从 pod1 卷曲到 pod2 的服务 url 时,它会间歇性地失败,并出现无法解决主机错误。
为了说明,我有 3 个 pod - pod1、pod2、pod3 当我使用
进入 pod1kubectl exec -it pod1
我使用 pod2 的服务 url 运行 curl:
该命令大约每 6/10 次成功一次,其余 4/10 次失败并出现错误“curl: (6) Could not resolve host:api-batchprocessing”。
当我尝试使用 curl 调用在 pod3 上运行的另一个服务时,我遇到了同样的问题。
我尝试了以下方法但没有成功: - 删除 kube-system 中的 coredns pod - 删除并重新创建 azure kubernetes 集群。 上面似乎暂时解决了它,但在几次尝试中,我得到了同样的间歇性“无法解决主机:”问题。
任何有关此问题的帮助/指针将不胜感激。
【问题讨论】:
-
这些都在同一个命名空间中吗?
-
是的,它们位于名为“开发”的同一个命名空间中
-
当你 ssh 进入一个 pod 时,尝试从那里对另一个服务名称进行 nslookup,让我们看看这里的结果
-
容器未安装实用程序。我一直在避免它,看来我需要这样做才能了解发生了什么......
标签: kubernetes azure-aks