【问题标题】:Stackdriver custom metric aggregate alertsStackdriver 自定义指标汇总提醒
【发布时间】:2017-12-02 03:30:48
【问题描述】:

我在 Google Compute Engine 和 Stackdriver 上使用 Kubernetes。 Kubernetes 指标在 Stackdriver 中显示为自定义指标。我成功地设置了一个带有图表的仪表板,其中显示了一些自定义指标,例如“节点 cpu 预留”。我什至可以设置所有节点 CPU 预留的聚合平均值,以查看我的 Kubernetes 集群 CPU 预留总量是否过高。见截图。

我的问题是,我似乎无法针对自定义指标的平均值设置警报。我可以在每个节点上设置警报,但这不是我想要的。我还可以设置“组聚合阈值条件”,但自定义指标似乎对此不起作用。注意下拉菜单中没有“自定义指标”。

有没有办法为自定义指标的聚合设置警报?如果没有,当我的 Kubernetes 集群的 CPU 预留太高时,我是否可以通过某种方式发出警报?

【问题讨论】:

    标签: kubernetes stackdriver google-compute-engine heapster google-cloud-monitoring


    【解决方案1】:

    目前在 Stackdriver 中不提供关于自定义指标聚合的警报。我们正在考虑针对您面临的问题的各种解决方案。 请注意,有时可以直接针对问题的症状发出警报,而不是监视底层资源。例如,如果您担心 cpu,因为 X 发生并且用户注意到,并且 X 不好 - 您可以考虑对 X 的症状发出警报,而不是在 cpu 上发出警报。

    【讨论】:

    • 就我而言,我希望在需要向我的 Kubernetes 集群添加更多节点时收到警报。所以我想我想看看 Pod 请求/保留了多少 CPU 和内存。
    • 自动缩放仅对我有用,因为我正在运行多区域和高可用性。
    • 这对您的自动缩放情况有帮助吗? github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/…
    猜你喜欢
    • 2020-09-15
    • 2020-05-14
    • 2021-08-31
    • 2019-11-18
    • 2018-05-14
    • 2020-01-25
    • 2018-07-09
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多