【发布时间】:2021-05-22 07:42:53
【问题描述】:
说明
我刚刚尝试使用我在 n1 上使用了几个月的个人帐户设置或保留用于机器学习的虚拟机,该帐户具有大约 8 GB 或更多 GB 的 RAM,以及用于机器的 P100 或 V100学习,现在尝试了至少一半的具有 P100/V100 可用性的区域,并且总是得到像这样的资源错误:
操作类型 [插入] 失败并显示消息“区域 'projects/lexical-list-285719/zones/us-central1-c' 没有足够的可用资源来满足请求。请尝试其他区域,或重试稍后。”
zone-x 中没有可用资源。我最近退出了试用期。
问题:
A) 这很常见吗?
B) 有解决办法吗?
C) 我可以做些什么(如果有的话)来获得具有这些规格或类似性能的机器?
我知道这是因为该区域没有这些规格可用,我应该尝试切换。我也知道托管实例组。但这不会那么难吧?
谷歌订完了吗?
可能的解决方案
目前我修复它的想法:
- 多区托管组(仍需检查我的项目是否与该组兼容)
- 遍历所有可用区域的云 shell 脚本(需要研究 shell 脚本的工作原理)
非常感谢任何对此主题有经验的人分享他们对解决方案或更好的解决方案的经验。
对我来说一个好的答案不包括以下任何一项:
-
区域切换(尝试过)
-
较小的机器(试过了,项目不适用于太小的机器)
-
保留(尝试过)
-
等待(已经知道了,如果我现在想要一台机器也无济于事)
虽然我建议那些不那么持久或紧迫的问题的人只做这些。
【问题讨论】:
-
能否提供准确的错误信息?在您尝试申请 P100/V100 的区域中,您是否有可用配额?如果没有,您是否尝试过请求增加配额?
-
您的 GCP 帐户有多久了?你用的是私人的吗?
-
第一次因配额失败,我请求并获得了确认的配额。 @SerhiiRohoza 几个月,是的,谢谢你帮助我
-
我能够毫无问题地创建 GPU 虚拟机,我只在尝试创建 V100 GPU 虚拟机时收到此错误,所以我猜没有可用的 V100.... 12 小时后再次尝试但还是什么都没有。
标签: google-cloud-platform cloud virtual-machine google-compute-engine