【发布时间】:2021-04-19 20:34:38
【问题描述】:
我尝试使用 GPU 创建 google_container_node_pool。 我尝试了机器类型 nvidia-tesla-p4 和 a2-highgpu-1g,每个都返回不同的错误:
projects/my-project-id/zones/us-central1-a/machineTypes/nvidia-tesla-p4
或
错误:创建 NodePool 时出错:googleapi:错误 403:不足 满足请求的区域配额:资源 “PREEMPTIBLE_NVIDIA_V100_GPUS”:请求需要“3.0”并且很短 '2.0'。项目的配额为“1.0”,“1.0”可用。查看和 管理配额 https://console.cloud.google.com/iam-admin/quotas?usage=USED&project=my-project-id., 禁止
当我查看配额页面时,相关配额显示“所有99个配额都在限制内”。
根据requirement 我需要配额,但他们没有指定哪个配额。
更新:
将 machine_type 更改为 a2-highgpu-1g 将错误消息更改为与不同的配额 A2_CPUS 相关。 当我将 preemptible 的值更改为 false,而不是 PREEMPTIBLE_NVIDIA_V100_GPUS 或 A2_CPUS 时,NVIDIA_A100_GPUS 出现相同的错误。 A2_CPUS 和 NVIDIA_A100_GPUS 的问题是我无法请求配额,因为 UI 中的复选框已禁用,并且限制显示为“无限制”:
【问题讨论】:
-
这个问题似乎已经有 2 个答案。如果有一个解决了您的问题,请投票或接受一个详细的here。如果您需要更多说明,请记住您也可以对答案发表评论。
-
我尝试了几次就放弃了,主要是因为其他紧迫的事情,我希望在下一个版本中恢复它,可能需要几周时间。
-
请看我更新的答案。 TL;DR 您应该请求增加 REGIONAL 配额,因为区域配额不可操作。
-
另外,请确保您在该地区有足够的 CPU + A2 CPU 配额
标签: terraform gpu google-kubernetes-engine