【发布时间】:2023-02-03 04:37:16
【问题描述】:
我想尝试顶点 ai 向量匹配服务,但是当我进行部署时,它总是将 n 16 台机器放在我的索引上。我想尝试使用更小的东西,但我在部署期间看不到特定机器类型的选项。 这是我的部署命令:
gcloud ai index-endpoints deploy-index 2056746450917785600 \
--deployed-index-id=postanndeploy \
--display-name=smallindexdeploy \
--index=5486800517113839616 \
--min-replica-count=1 \
--max-replica-count=2 \
--project=myproject \
--region=us-central1
在我完成部署后,当我查看部署时,我看到了 n16 机器。这比我的 POC 需要的要大得多。有没有一种方法可以让我在更小的机器上做到这一点而不用担心成本。
马尼什
【问题讨论】: