Prometheus 告警收敛

  告警面临最大问题,是警报太多,相当于狼来了的形式。收件人很容易麻木,不再继续理会。关键的告警常常被淹没。在一问题中,alertmanger在一定程度上得到很好解决。
  Prometheus成功的把一条告警发给了Altermanager,而Altermanager并不是简简单单的直接发送出去,这样就会导致告警信息过多,重要告警被淹没。所以需要对告警做合理的收敛。

 

告警收敛手段:

  • 分组(group):将类似性质的警报分类为单个通知
    •        1、减少报警消息的熟练
    •   2、同类告警聚合帮助运维排查问题
  • 抑制(Inhibition):当警报发出后,停止重复发送由此警报引发的其他警报
  • 配置文件:vim alertmanager.yml
     # inhibit_rules标记:降低告警收敛,减少报警,发送关键报警
     inhibit_rules:
       # source_match: 匹配当前告警发生后其他告警抑制掉
       - source_match:
           # severity: 指定告警级别
           severity: 'critical'
         # target_match:抑制告警
         target_match:
           # severity: 指定抑制告警级别
           severity: 'warning'
         # equal: 只有包含指定标签才可成立规则
         equal: ['alertname', 'dev', 'instance']
    抑制配置文件

相关文章:

  • 2021-06-10
  • 2021-09-14
  • 2021-04-02
  • 2021-08-20
  • 2021-07-09
  • 2021-10-01
  • 2023-02-23
猜你喜欢
  • 2022-12-23
  • 2021-11-17
  • 2021-06-26
  • 2021-07-21
  • 2021-10-13
  • 2022-12-23
  • 2022-12-23
相关资源
相似解决方案