【发布时间】:2020-10-28 04:21:32
【问题描述】:
我使用“pip install 'apache-airflow[statsd]' 安装了气流[statsd],并安装了 statsd_exporter。现在我可以从 Prometheus 看到气流指标。但所有与气流相关的指标都有 dag_id 和 task_id 作为一部分指标名称。
例如,对于任务 ID 为“task1”的 dag id“dag1”,完成任务所用时间的指标是:airflow_dag_dag1_task1_duration。对于任务 ID 为“task2”的 dag id“dag2”,指标为:airflow_dag_dag2_task2_duration。
我感兴趣的是:如果任何 dag 失败,则触发警报,或者如果 dag 完成时间超过 XXX 秒,则触发警报。换句话说,我不想为每个单独的 dag 或任务创建规则和警报。我想提醒一般情况。
如何在 Prometheus 中为通用案例创建规则/警报?
【问题讨论】:
标签: airflow prometheus prometheus-node-exporter