【问题标题】:Prometheus Alert not working for an event based metricPrometheus Alert 不适用于基于事件的指标
【发布时间】:2021-02-02 16:28:51
【问题描述】:

我有一个指标,仅在发生特定事件时才发送数据。换句话说,它不会每 15 秒定期进行一次连续遥测,但它会针对单个数据点进行。现在,我配置了一个警报来检查指标是否存在(规则中没有包含任何“for”条件,因为不需要等待),应该触发一个警报。

发生的情况是,当指标在 Prometheus 中可用时,该规则会在 Prometheus UI 中激活为黄色,但不会触发,而是在 15 秒内自动消失。我是否需要做一些额外的设置来提醒基于事件的指标仅持续 1 个单个数据点或 15 秒?

谢谢, 阿纳夫

【问题讨论】:

  • 您能否添加一个衡量这些事件的指标,而不是使用仪表(我假设)?
  • 实际上,我是在灭霸标尺组件中尝试这个,而不是在普罗米修斯中。这会有什么不同吗?因为相同的查询和警报在 Prometheus 中运行良好。但是,当我在 Thanos 而不是 Prometheus 中部署时,基于事件的警报停止工作,如果遥测持续时间不超过 15 秒,它会自行解决。
  • K_Event_Count{EvId="24171643",EvMessage="fan alarm"} - 这是查询。该指标是连续的,但具有特定值的标签是在特定情况下生成的,并且仅在一个数据点或 15 秒内发送。

标签: prometheus prometheus-alertmanager


【解决方案1】:

我用了 1m 的 count_over_time 并且成功了。尽管数据只存在了 15 秒,但查询使其持续了 1m,并且警报正确触发。

【讨论】:

    猜你喜欢
    • 2021-12-26
    • 2022-06-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多