基于队列长度的 Google Compute Engine 自动缩放答案

【问题标题】：Google Compute Engine auto scaling based on queue length基于队列长度的 Google Compute Engine 自动缩放
【发布时间】：2016-04-12 23:46:21
【问题描述】：

我们在 Google Compute Engine 上托管我们的基础架构，并正在研究针对实例组进行自动缩放。我们对队列中的二进制数据进行了大量批处理。在我们的例子中，这意味着：

但是，我发现很难找到一种在 Google Compute Engine 上自动扩展此功能的方法，因为它们似乎可以根据 CPU 等仅实例指标进行扩展。来自documentation：

并非所有自定义指标都可以由自动缩放器使用。选择一个有效的自定义指标，该指标必须具有以下所有内容属性：

指标必须是每个实例的指标。

该指标必须是有效的利用率指标，这意味着来自该指标的数据可用于按比例放大或缩小虚拟机的数量。

如果我正确阅读了文档，这是否会导致难以在全局队列长度上使用自动缩放？

备份解决方案

【问题讨论】：

正如 grzenio 在他的回答中提到的那样，此功能尚不可用于自动缩放。话虽如此，您可以通过 GCE 问题跟踪器 (code.google.com/p/google-compute-engine/issues) 提交功能请求。
听从 Faizan 的建议，我在 code.google.com/p/google-compute-engine/issues/detail?id=291 上创建了一个功能请求

【解决方案1】：

从 2018 年 2 月（测试版）开始，这可以通过 stackdriver 中的“每组指标”实现。

每组指标允许使用标准或自定义指标进行自动扩缩不导出每个实例的利用率数据。相反，该组基于适用于整个组的值进行缩放，并且对应于该组有多少工作可用或有多忙该组是。该组根据该组的波动进行缩放指标值和您定义的配置。

操作方法太长，无法在此处发布。

【讨论】：

【解决方案2】：

据我了解，这尚未实施（截至 2016 年 1 月）。目前，自动缩放仅针对 Web 服务场景，您希望从您的机器提供网页/其他 Web 服务，并为流量峰值保留一些合理的空间（例如，在 CPU 或其他指标方面）。然后系统将调整实例/虚拟机的数量以匹配您的目标。

您正在寻找批处理场景的自动缩放功能，但目前无法满足此需求。

【讨论】：