【问题标题】:How much time for GPU quota updating?GPU配额更新需要多少时间?
【发布时间】:2021-01-21 15:37:26
【问题描述】:

我正在 Google Cloud 上尝试一些东西,但遇到了以下问题。几天前,我用 Compute Engine 创建了一个深度学习 VM,它有 8 个 vCPU 和 1 个 Tesla K80 GPU。一切正常,但现在我想尝试另一个具有不同内存大小的 GPU。因此,我删除了 VM 实例(从 Compute Engine -> VM 实例),还从部署管理器中删除了部署。尽管如此,当我尝试创建一个新 VM 时,我收到一条错误消息,指出我没有更多可用资源,事实上,在配额页面中,我仍然看到 GPU 使用率为 1(限制为 1,这就是为什么我不能创建一个新实例)。有谁知道可能是什么问题?我只需要等待吗?谢谢大家!

【问题讨论】:

  • 错误信息是什么?这个document 可能适用于您的问题。如果您使用 AI Platform Training,则有 special quota policies 因资源而异。如果您使用的是Google Cloud free trial,则无法请求更改您的配额。
  • 一般需要 24-48 小时
  • 嗨@William,感谢您的回复。错误信息如下:{"ResourceType":"compute.v1.instance","ResourceErrorCode":"ZONE_RESOURCE_POOL_EXHAUSTED","ResourceErrorMessage":"The zone 'projects/mlai2020-exam-project/zones/us-west1-b' does not have enough resources available to fulfill the request. Try a different zone, or try again later."}我正在尝试用计算引擎实例化一个深度学习虚拟机。

标签: google-cloud-platform google-compute-engine


【解决方案1】:

如果您在请求新资源时收到资源错误(例如ZONE_RESOURCE_POOL_EXHAUSTED 或 ZONE_RESOURCE_POOL_EXHAUSTED_WITH_DETAILS),则表示该区域目前无法满足您的请求。

此错误是由于该地区的 Compute Engine 资源可用,因此,您可以尝试在该地区的另一个地区或另一个地区创建资源。 您可以在此文档上搜索另一个可用区域:Available regions and zones

如果可能,请更改您请求的 VM 的形状。获得更小的机器类型比获得更大的机器类型更容易。对您的请求进行更改(例如减少 GPU 数量或使用内存或 vCPU 较少的自定义虚拟机)可能会允许您的请求继续进行。

此外,您可以create reservations 使用自定义或预定义的机器类型在特定区域中的虚拟机 (VM) 实例,带或不带额外的 GPU 或本地 SSD,以确保资源在您需要时可用于您的工作负载.

此外,您可以在以下link中找到更多信息来解决此问题

【讨论】:

  • 您好何塞,感谢您的回复。根据您链接的文档中显示的可用性,我尝试遵循您的建议并多次更改区域。不幸的是,我一直收到同样的错误。
  • 你提到你想尝试另一个不同内存大小的GPU:你能分享一下你想创建的机器类型吗?是custom machine type?,您尝试了哪些区域?您是否尝试过this link 上提到的所有建议
  • 其实经过几次尝试我终于成功了,所以你的建议是正确的。非常感谢!
猜你喜欢
  • 1970-01-01
  • 2019-04-29
  • 2017-08-30
  • 2016-09-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多