顶点人工智能匹配服务机器答案

【问题标题】：vertex ai matching service machines顶点人工智能匹配服务机器
【发布时间】：2023-02-03 04:37:16
【问题描述】：

我想尝试顶点 ai 向量匹配服务，但是当我进行部署时，它总是将 n 16 台机器放在我的索引上。我想尝试使用更小的东西，但我在部署期间看不到特定机器类型的选项。这是我的部署命令：

gcloud ai index-endpoints deploy-index 2056746450917785600 \
  --deployed-index-id=postanndeploy \
  --display-name=smallindexdeploy \
  --index=5486800517113839616 \
  --min-replica-count=1 \
  --max-replica-count=2 \
  --project=myproject \
  --region=us-central1

在我完成部署后，当我查看部署时，我看到了 n16 机器。这比我的 POC 需要的要大得多。有没有一种方法可以让我在更小的机器上做到这一点而不用担心成本。

马尼什

【问题讨论】：

标签： google-cloud-vertex-ai

【解决方案1】：

匹配引擎部署的机器类型将取决于您在创建索引时设置的分片级别。如果未指定任何内容，则默认分片为 SHARD_SIZE_MEDIUM。

SHARD_SIZE_MEDIUM 默认使用 e2-standard-16 机器。对于较小的用例，您可以尝试使用 SHARD_SIZE_SMALL。旋转的机器数量将取决于索引的大小。用于SHARD_SIZE_SMALL 的机器将是 e2-standard-2 实例。

但是，此类实例的数量将取决于您的整体索引大小。匹配引擎监控仪表板会告诉您为您的特定索引创建了多少个实例。

你可以从谷歌找到更多与索引大小和实例相关的文档here。

【讨论】：