【问题标题】:aggregating codahale metrics counts across ECS task instances in CloudWatch在 CloudWatch 中跨 ECS 任务实例聚合 codahale 指标计数
【发布时间】:2021-07-14 08:00:20
【问题描述】:

我有一个 ECS 服务向 CloudWatch 报告使用 Codahale Metrics 收集的指标。一些指标是计数,例如对外部服务的请求计数。每个服务实例都维护自己的计数并向 CloudWatch 报告。据我了解,这意味着 CloudWatch 中的计数值是每项服务的个人计数,而无法查看总数。如果每个实例发出 300 个请求,则报告的值将是 300,无法将其加起来为 900。

修复它的最佳方法是什么?是否以这种方式向报告的 CloudWatch 指标添加带有例如 ecs 任务 ID 的附加维度?

我在 Grafana 中绘制结果,但可能不是重要部分。

【问题讨论】:

    标签: monitoring amazon-ecs amazon-cloudwatch metrics codahale-metrics


    【解决方案1】:

    指标已经在Cloudwatch 中聚合,假设它们具有相同的命名空间和名称。如果这些服务请求指标相同,它们应该是相同的指标,那么您可以向它们添加维度,例如TaskIdRequestedService 或您想要聚合的任何内容。

    通常,您在Cloudwatch Metrics 中遇到的挑战与您所描述的相反。指标已经聚合在一起,然后您想要深入到特定值以调试某些问题,例如,如果您对特定容器任务有问题,您将设置维度 TaskId=todo1,或者如果您怀疑服务已关闭你会设置RequestedService=todo2

    我怀疑您正在为您发出请求的每项服务创建一个指标,而不是您只需要一个指标,并如前所述为其添加维度。

    对于这个特定的用例,您可能还需要考虑开放遥测/X-Ray,它将为您创建一个服务图并处理通过不同服务跟踪请求的特定情况。不过,这确实需要一些努力来设置。

    【讨论】:

      猜你喜欢
      • 2018-11-19
      • 2020-04-09
      • 2020-12-25
      • 1970-01-01
      • 1970-01-01
      • 2020-02-13
      • 2017-04-14
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多