【问题标题】:Amazon Cloudwatch alarm not triggeredAmazon Cloudwatch 警报未触发
【发布时间】:2015-09-28 08:45:35
【问题描述】:

我配置了 cloudwatch 警报:

阈值:连续 1 个周期“大于 0”,

时间:1分钟,

统计:总和

警报配置在 AWS SQS NumberOfMessagesSent 之上。队列是空的,没有消息发布到它。我手动发送了一条消息。我可以看到指标的峰值,但警报状态仍然可以。我有点困惑,为什么即使满足触发此警报的所有条件,此警报也不会改变其状态。

【问题讨论】:

  • 您有与警报相关的操作吗?你什么时候看的?它的工作方式是它会在下一分钟进入 ALARM 并返回 OK。因此,如果您查看了错误的时间,或者在报告中捕捉到了分钟的结尾,那么您可能没有观察到它(但它确实发生了)
  • 我为每个状态附加了一个动作 - ALARM、OK、INSUFFICIENT-STATE。操作是发送电子邮件,但我也没有收到任何电子邮件。
  • @JuhiKulshreshtha - 面临同样的问题。你想出解决办法了吗?如果是,请分享。

标签: amazon-web-services amazon-sqs amazon-cloudwatch


【解决方案1】:

可能是间隔时间设置为小于 300 秒。免费的 CloudWatch 每 5 分钟检查一次,因此如果您设置的警报时间低于该值,您有时会收到 INSUFFICIENT_DATA。

【讨论】:

    【解决方案2】:

    在 AWS 支持的帮助下,我刚刚克服了这个问题。您需要将闹钟的时间段设置为约 15 分钟。这与 SQS 在将事件推送到 CloudWatch 时如何标记事件的时间戳有关。

    不用担心,将时间段设置为更大的数字不会影响您收到警报的速度。它仍会每 5 分钟从 SQS 获取数据。

    【讨论】:

    • 虽然很不直观,但我可以确认这是可行的。
    • 我也可以确认
    • 我今天遇到了同样的问题。对于发现此问题的任何其他人,现在可以通过使用已添加的"M out of N" datapoints 功能来改进(如果您需要)上面的答案。您可以设置 5 分钟的时间段和“2 个数据点中的 1 个”,基本上让您的评估期为 10 分钟。如上所述,您的警报仍会在消息发送到队列后约 5 分钟内触发,但由于评估周期是 10 而不是 15,它会比 15 分钟周期早约 5 分钟重置为 OK。跨度>
    • 通过“将闹钟的时间段设置为约 15 分钟”——这是否意味着闹钟将每 15 分钟检查一次指标,因此只能以至少 15 分钟的间隔进行缩放?另外,当我们将周期设置为 15 分钟时,是否需要调整指标值(例如:NumberOfMessagesSent 将是我们使用 5 分钟的值的 3 倍)?
    • FWIW 我使用“AWS/ApiGateway”“5xx”错误指标遇到了这个问题。当我将时间段更改为 15 分钟时,它起作用了。当我将时间段更改为 5 分钟并根据@jstill 的评论使用“2 个中的 1 个”数据点发出警报时,它也起作用了
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-03-26
    相关资源
    最近更新 更多