【问题标题】:How to setup a monitoring dashboard for Uptime Check Services in Datadog如何在 Datadog 中设置正常运行时间检查服务的监控仪表板
【发布时间】:2023-01-26 19:43:01
【问题描述】:

需要帮助如何使用 Datadog 仪表板中的任何图表创建正常运行时间检查服务监控,目的是例如我需要在一周内检查,特定服务发生了多少停机时间。谢谢你的帮助!

【问题讨论】:

    标签: datadog datadog-dashboard


    【解决方案1】:

    您可以按照以下步骤操作:

    1. 创建一个 Datadog 帐户并在要监控的机器上安装 Datadog Agent

    2. 创建一个新的仪表板并添加一个图形小部件,选择指标“system.uptime.check”作为数据源。可以通过 Metrics API (https://docs.datadoghq.com/api/?lang=bash#metrics-api) 自定义指标来跟踪您的服务的正常运行时间

    3. 配置图形小部件以显示您要监视的服务的数据

    4. 使用“警报”选项卡设置服务停机时的警报

      (5. 可选:使用“仪表板设置”选项卡自定义仪表板的外观)

      更多信息可以参考Datadog的文档网页:https://docs.datadoghq.com/

    【讨论】:

    • 感谢@vmicrobio 的回答,但上面的文档页面是 404,我没有在指标中看到任何“system.uptime.check”变量
    • 抱歉,我从我的笔记本 (2021) 中复制/粘贴了一些信息,因为文档已被删除,它可能已被弃用。检查docs.datadoghq.com,我也会更新我的答案。关于“system.uptime.check”,您可以使用 Metrics API (docs.datadoghq.com/api/?lang=bash#metrics-api) 创建自定义指标来跟踪服务的正常运行时间,以发送自定义指标并在仪表板中显示有关服务正常运行时间的信息。
    猜你喜欢
    • 2017-04-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-07-11
    • 2020-10-05
    • 1970-01-01
    相关资源
    最近更新 更多