【发布时间】:2019-08-29 15:01:02
【问题描述】:
在我的 Kubernetes 集群中,我有 Prometheus、Grafana 用于监控堆栈和 EFK 堆栈用于日志。
我创建了一些由来自 node-exporter 的指标触发的 Grafana 警报。
另外,我可以在 Kibana 上看到 Kubernetes 节点 (VM) 日志。
当节点一段时间没有日志时,我想在 Grafana 上创建警报。
最好的方法是什么?
我将 ElasticSearch (ES) 作为数据源连接到 Grafana。我可以在 Grafana 图表上看到 ES 日志指标。但是,这个解决方案似乎有问题。
因为集群可能是 - 缩小比例 - 升级,当所有旧节点都消失并创建新节点时。
第一次不是什么大问题(如果警报仅在第一次满足条件时触发)
第二个可能会导致几十个警报。
【问题讨论】:
-
“一段时间”是什么意思?
-
“某个时间”表示几个小时。
-
请投票/接受答案,让社区知道有用性,谢谢!
标签: kubernetes monitoring prometheus-node-exporter