【发布时间】:2019-03-05 09:00:27
【问题描述】:
我们在 docker swarm 上安装了一个 treafik,通过 traefik 平衡了几个服务。每个服务至少有两个后端,平衡了 wrr 和一个运行状况检查。
有没有办法(api、rest 端点、日志文件等等)找出哪些前端有死后端?死亡是指 treafik 在哪些后端通过运行状况检查检测到它们不符合平衡条件?
这方面的最佳做法是什么?
【问题讨论】:
标签: docker-swarm traefik
我们在 docker swarm 上安装了一个 treafik,通过 traefik 平衡了几个服务。每个服务至少有两个后端,平衡了 wrr 和一个运行状况检查。
有没有办法(api、rest 端点、日志文件等等)找出哪些前端有死后端?死亡是指 treafik 在哪些后端通过运行状况检查检测到它们不符合平衡条件?
这方面的最佳做法是什么?
【问题讨论】:
标签: docker-swarm traefik
我看到了两种获取该信息的方法:
查看Traefik log,它提供了健康检查的跟踪信息:
time="2019-03-05T22:19:35Z" level=debug msg="Refreshing health check for backend: backend-web-so-55004614", time="2019-03-05T22:19:35Z" level=warning msg="Health check still failing. Backend: \"backend-web-so-55004614\" URL: \"http://192.168.80.2:80\" Reason: received error status code: 404", time="2019-03-05T22:19:36Z" level=debug msg="Refreshing health check for backend: backend-web-so-55004614", time="2019-03-05T22:19:36Z" level=warning msg="Health check still failing. Backend: \"backend-web-so-55004614\" URL: \"http://192.168.80.2:80\" Reason: received error status code: 404",
/metrics
如果不方便解析 Traefik 日志,可以激活 Traefik Prometheus 指标(默认开启):
docker run -d -v /var/run/docker.sock:/var/run/docker.sock -p "80:80" -p "8080:8080" traefik --api --docker
然后您可以在http://localhost:8080/metrics 上进行HTTP 查询并查找包含_backend_server_up 的行。这些行中的每一行都告诉你你的后端是正常的。如果缺少后端,则意味着它不健康或已停止:
traefik_backend_server_up{backend="backend-robots",url="http://172.23.0.3:80"} 1
traefik_backend_server_up{backend="backend-smtp-ui",url="http://172.25.0.3:8025"} 1
traefik_backend_server_up{backend="backend-varnish-admin",url="http://172.23.0.8:6085"} 1
traefik_backend_server_up{backend="backend-varnish-http",url="http://172.23.0.8:6081"} 1
traefik_backend_server_up{backend="backend-web-apps",url="http://172.21.0.2:80"} 1
traefik_backend_server_up{backend="backend-web-report",url="http://172.19.0.6:80"} 1
您可以使用脚本查询此 URL,或者您可以安装具有 alerting rules 的 Prometheus
【讨论】: