【问题标题】:Grafana Alerting when there is no change in data for x minutes当数据在 x 分钟内没有变化时发出 Grafana 警报
【发布时间】:2018-09-28 08:43:27
【问题描述】:

在网上和论坛上翻来覆去,找不到这方面的资源。

我要实现的是在一段时间内数据没有变化时创建警报。

我们正在监控我们的网络服务器的打开文件,所以这个数字经常波动。请注意,当数字停滞不前时,它指向服务器上的问题。所以我们想要的是如果 openfile 保持 X 2 分钟提醒我们。

【问题讨论】:

  • grafana 只是用于可视化数据,我认为你不能单独使用 grafana 来做到这一点。你需要像 prometheus 和它的 alert 模块来做到这一点。
  • 谢谢,我想了很多,但只是想确定一下。

标签: grafana-alerts


【解决方案1】:

我通过一连串的事情发出了这样的警告:

  1. 我有一个专用的“警报虚拟板”,用于所有警报,因为每个图表只能有一个警报(grafana 版本 6.6.0)
  2. 我使用以下查询:avg_over_time(delta(Sensor_Data[1m])[20s:]) - 这会计算 'first_value-last_value of 1min interval' 的 20 秒平均值
  3. 我的数据收集程序输入 prometheus,然后输入 grafana - 如果这个程序冻结,它可能会继续向 prometheus 发送最后一个值,并且上述查询将降至严格为零。
  4. 所以我有一个警报,如果上述查询在一分钟内处于范围 (-0.01, 0.01) 内(上述查询在系统运行时的典型值是 abs(query) > 0.18)

因此,如果 Sensor_Data 值在大约 2-3 分钟内没有变化,Grafana 会发送警报。

【讨论】:

    【解决方案2】:

    这对我有用。确保您使用的是 rate 或 increase 函数(没有变化意味着它将下降到零)并过滤查询,如下所示:

    increase(metric_name) > 0
    

    然后,在警报配置中,将“如果没有数据或所有值都为空”设置为“警报”。这样,当没有数据时,就会触发警报。

    【讨论】:

    • 那是完全不同的事情。您使用的数据本身就是变化的指标。问题在于任意指标停滞在任何值。
    【解决方案3】:

    如果您确实使用 Prometheus 和警报管理器,有一个很好的功能对我有用。

    changes

    因此,如果在时间间隔内没有更改,则在警报管理器中使用类似的东西会触发 changes(metric_name[5m]) = 0

    【讨论】:

      猜你喜欢
      • 2019-09-04
      • 2021-02-20
      • 2020-06-22
      • 1970-01-01
      • 2023-01-17
      • 2021-11-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多