【问题标题】:Slurm sinfo formatSlurm sinfo 格式
【发布时间】:2016-11-03 01:15:39
【问题描述】:

当我在 slurm 中使用“sinfo”时,我在其中一个分区附近看到一个星号(例如:RUNNING-CLUSTER*)。

分区看起来不错,其下的所有节点都处于空闲状态。

例如,当我使用“sleep 300”运行一个简单的脚本时,我可以看到队列中的作业(使用“squeue”),但它们会运行几秒钟并结束。没有错误消息(我可以在日志中看到他们失败了。那里没有更多信息)。

知道星号是干什么用的吗? 说明书上没找到。

谢谢。

【问题讨论】:

  • @VermillionAzure - “Slurm 是一个开源工作负载管理器,专为各种规模的 Linux 集群而设计。它提供了三个关键功能。”。从这里:[slurm.schedmd.com/]
  • 恕我直言,这个问题更适合ServerFault,但这里不是主题。

标签: slurm


【解决方案1】:

分区名称后面的“*”表示这是提交作业的默认分区。 LLNL 提供了直接支持我的发现的文档:

LLNL Documentation

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-03-22
    • 1970-01-01
    • 2022-08-19
    • 1970-01-01
    • 2014-06-19
    • 1970-01-01
    相关资源
    最近更新 更多