【问题标题】:ML Units exceed the allowed maximumML 单位超过允许的最大值
【发布时间】:2017-12-22 11:44:54
【问题描述】:

当我尝试提交在 Google Cloud-ML 中训练模型的作业时,我收到以下错误。

RESOURCE_EXHAUSTED: Quota failure for project my_project.
The requested 16.536900000000003 ML Units exceed the allowed maximum of 15.To read more about Cloud ML Engine quota, see https://cloud.google.com/ml-engine/quotas.
- '@type': type.googleapis.com/google.rpc.QuotaFailure
  violations:
  - description: The requested 16.536900000000003 ML Units exceed the allowed maximum
  of 15.
subject: my_project

现在我的问题是,这个配额会在几个小时或几天后重置吗?还是我需要要求增加 ML 单位?如果有,该怎么做?

【问题讨论】:

  • 我们的配额系统从昨天开始出现问题,今天已解决。如果您以前可以提交类似配置的作业,那么您可能会受到配额问题的影响,请重试。否则,请与我们联系以增加配额。
  • 感谢您提供的信息。现在已解决。 :)

标签: tensorflow google-cloud-platform tensorflow-gpu google-cloud-ml


【解决方案1】:

lleo@的回答是正确的; this section 声明如下:

典型项目,首次使用 Cloud ML Engine 时受限于 并发处理资源数:

  • ML 训练单元的并发数:15。

但要直接回答您的问题:这是每个作业的配额(不是几个小时或几天后“补充”的东西)。因此,直接的解决方案是简单地提交一份工人较少的工作。

通过新项目访问有限资源在 Google Cloud Platform 上很常见,但您可以发送电子邮件至 cloudml-feedback@google.com 以查看您是否有资格获得增加。

【讨论】:

    【解决方案2】:

    正如徐国庆在 cmets 中所说,有一个问题。他们已经解决了这个问题,我现在可以成功提交我的工作了。

    对我来说,只有一份工作,而且工作也很轻松。此外,没有进行并行计算。因此,我很困惑为什么会达到配额。

    现在已经解决了,工作正常。感谢 Google 团队解决此问题。 :)

    【讨论】:

      【解决方案3】:

      您可以在此处阅读默认限制here 您可能会要求增加配额(在控制台的 API Manager 页面上)。您的问题似乎与使用的并发 ML 单元有关,因此您可以重构您的训练管道或要求增加配额。

      【讨论】:

        猜你喜欢
        • 2015-05-20
        • 1970-01-01
        • 2014-09-02
        • 2016-11-12
        • 1970-01-01
        • 2022-07-12
        • 2021-05-19
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多