【发布时间】:2019-04-11 00:25:12
【问题描述】:
我想检查某个指标是否在 prometheus 5 分钟内不可用。
我正在使用缺席(K_KA_GCPP)并给出 5 分钟的阈值。但似乎我无法在某些标签(如 Site Id)上对缺少的功能进行分组。
如果指标不适用于所有 4 个站点 ID,则“缺席”有效。我想了解所有 4 个站点 ID 中的 1 个站点 ID 的指标是否不可用或不存在,并且我不想在查询中对站点 ID 标签进行硬编码,它应该是通用的。有什么办法可以做到吗?
【问题讨论】:
-
你找到方法了吗?
-
没有。我现在正在使用缺席和硬编码我的网站 ID。
-
我也在做同样的事情,我发现在 up 上缺席的唯一其他方法是在 up{metric} == 0 上发出警报,启动警报的时间为 30 秒或更短第一次通话
标签: prometheus prometheus-alertmanager promql