Stackdriver 自定义指标汇总提醒答案

【问题标题】：Stackdriver custom metric aggregate alertsStackdriver 自定义指标汇总提醒
【发布时间】：2017-12-02 03:30:48
【问题描述】：

我在 Google Compute Engine 和 Stackdriver 上使用 Kubernetes。 Kubernetes 指标在 Stackdriver 中显示为自定义指标。我成功地设置了一个带有图表的仪表板，其中显示了一些自定义指标，例如“节点 cpu 预留”。我什至可以设置所有节点 CPU 预留的聚合平均值，以查看我的 Kubernetes 集群 CPU 预留总量是否过高。见截图。

我的问题是，我似乎无法针对自定义指标的平均值设置警报。我可以在每个节点上设置警报，但这不是我想要的。我还可以设置“组聚合阈值条件”，但自定义指标似乎对此不起作用。注意下拉菜单中没有“自定义指标”。

有没有办法为自定义指标的聚合设置警报？如果没有，当我的 Kubernetes 集群的 CPU 预留太高时，我是否可以通过某种方式发出警报？

【问题讨论】：

标签： kubernetes stackdriver google-compute-engine heapster google-cloud-monitoring

【解决方案1】：

目前在 Stackdriver 中不提供关于自定义指标聚合的警报。我们正在考虑针对您面临的问题的各种解决方案。请注意，有时可以直接针对问题的症状发出警报，而不是监视底层资源。例如，如果您担心 cpu，因为 X 发生并且用户注意到，并且 X 不好 - 您可以考虑对 X 的症状发出警报，而不是在 cpu 上发出警报。

【讨论】：

就我而言，我希望在需要向我的 Kubernetes 集群添加更多节点时收到警报。所以我想我想看看 Pod 请求/保留了多少 CPU 和内存。
自动缩放仅对我有用，因为我正在运行多区域和高可用性。
这对您的自动缩放情况有帮助吗？ github.com/kubernetes/autoscaler/blob/master/cluster-autoscaler/…