【发布时间】:2019-07-25 02:46:52
【问题描述】:
我已经在我的 kubernetes 集群中设置了 Grafana 进行监控。但是我真的很好奇如何监控监控系统(Grafana)??
我能想到的一个解决方案是在 prometheus-alertmanager 中设置警报,这样每当 Grafana pod 进入错误/CarshLoopBackOff 状态时,我都会收到警报。
【问题讨论】:
标签: grafana prometheus-alertmanager
我已经在我的 kubernetes 集群中设置了 Grafana 进行监控。但是我真的很好奇如何监控监控系统(Grafana)??
我能想到的一个解决方案是在 prometheus-alertmanager 中设置警报,这样每当 Grafana pod 进入错误/CarshLoopBackOff 状态时,我都会收到警报。
【问题讨论】:
标签: grafana prometheus-alertmanager
Grafana 能够以 Prometheus 格式 (https://grafana.com/docs/administration/metrics/) 公开自己的指标。所以配置抓取并发送警报并不是什么大问题,以防作业失败
- alert: GrafanaDown
expr: up{job="GrafanaDown"} == 0
for: 1m
labels:
severity: critical
annotations:
summary: "Instance {{ $labels.instance }} is down"
description: "{{ $labels.instance }} of job {{ $labels.job }} is down."
【讨论】: