【问题标题】:Constraint missing devices filtered 1 node, nomad job约束缺失设备过滤了 1 个节点,游牧作业
【发布时间】:2022-06-16 04:05:31
【问题描述】:

我正在尝试向 nomad 添加 GPU 资源,但出现以下错误

我的工作描述是

job "test" {


datacenters = ["dc1"]
  group "echo" {
    count = 1
    task "server" {
      driver = "docker"
      config {
        image = "hashicorp/http-echo:latest"
      }
      resources {
        device "gpu" {
          count = 1
        }
      }
    }
  }
}

我无法识别设备块,当我删除它时一切正常

我得到了

Constraint missing devices filtered 1 node

游牧 1.3.1

【问题讨论】:

    标签: nomad


    【解决方案1】:

    在指纹识别期间,设备插件会报告检测到的设备数量、每个设备的一般信息(供应商、类型和型号)以及设备特定属性(例如可用内存、硬件功能)。插件返回的信息从客户端传递到服务器,并可用于调度作业,使用任务资源节中的设备节,例如:

    resources {
      device "vendor/type/model" {
        count = 2
        constraint { ... }
        affinity { ... }
      }
    }
    

    设备参数名称(字符串:“”)- 指定所需的设备。以下输入有效:

    :如果给定单个值,则假定它是 设备类型,例如“gpu”或“fpga”。

    /:如果给定的两个值用 / 分隔,则 将选择给定的设备类型,限制在提供的 小贩。示例包括“nvidia/gpu”或“amd/gpu”。

    //: 如果给出三个值 a /,将选择给定的设备类型,限制在 提供供应商和型号名称。示例包括“nvidia/gpu/1080ti” 或“nvidia/gpu/2080ti”。

    count (int: 1) - 指定给定设备的实例数 这是必需的。

    constraint (Constraint: nil) - 限制哪些设备的约束 有资格。这可以提供多次以定义额外的 约束。请参阅下面的可用属性。

    affinity (Affinity: nil) - 指定偏好的关联 设备被选中。这可以提供多次来定义 额外的亲和力。请参阅下面的可用属性。

    以下示例作业仅显示设备节替换自己的作业:

    resources {
          device "nvidia/gpu" {
            count = 1
          }
    

    在此处查看source

    【讨论】:

      猜你喜欢
      • 2021-03-29
      • 2022-10-08
      • 2021-09-10
      • 2023-01-30
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2018-11-29
      • 1970-01-01
      相关资源
      最近更新 更多