【问题标题】:How to set a GCP Cloud Monitoring (Stackdriver) alert policy period greater than 24 hours?如何将 GCP Cloud Monitoring (Stackdriver) 警报政策周期设置为大于 24 小时?
【发布时间】:2021-06-14 19:32:46
【问题描述】:

目前 24 小时是可以设置 Cloud Monitoring(以前的 Stackdriver)警报政策的时间限制。

但是,如果您有日常活动,例如数据库备份,则每天可能需要或多或少的时间(例如,一天运行 1 小时 10 分钟,第二天运行 1 小时 12 分钟)。在这种情况下,您可能在距离上一个指示器 24 小时 2 分钟后才能看到完成指示器。这将导致 Stackdriver Monitoring 发出警报(因为您超过了警报窗口限制 +2 分钟)。

有没有办法更好地处理这些警报中的差异,例如 25 小时回顾期?

【问题讨论】:

  • 嗯,有意思,请问你的数据库备份文件存放在哪里,是GCS存储桶吗?
  • 谢谢,@Prany。我没有使用 GCS。此警报指标基于表明 Google 托管备份已完成的审核日志条目。

标签: google-cloud-platform stackdriver google-cloud-stackdriver google-cloud-monitoring


【解决方案1】:

目前,没有办法增加超过 24 小时的周期时间。

但是,已经为此打开了一个功能请求。

您可以在此公共链接 [1] 中关注它。

干杯,


[1]https://issuetracker.google.com/175703606

【讨论】:

  • 这个问题在大约 1 个月前被标记为Fixed
【解决方案2】:

我找到了解决这个问题的方法。

  1. 为您的工作开始时间创建一个指标(例如started_metric
  2. 为您的工作完成时间创建一个指标(例如completed_metric

现在创建一个由两部分组成的警报策略

  1. 要求started_metric 每 24 小时出现一次
  2. 要求completed_metric 每 24 小时出现一次
  3. 如果满足上述 (1) 和 (2) 则触发(例如,两者都 > 24 小时)

这可以解决 24 小时作业抖动问题,因为作业可能需要 24 小时以上才能完成,但它应该始终在 24 小时内启动(例如 cron 作业)。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-07-05
    • 1970-01-01
    • 2023-03-16
    • 1970-01-01
    • 2020-05-02
    • 1970-01-01
    • 2021-11-28
    • 2020-10-23
    相关资源
    最近更新 更多