【问题标题】:How does one specify in slurm to send e-mail when a single job finishes and not when each slurm array task finishes?如何在 slurm 中指定在单个作业完成时而不是在每个 slurm 阵列任务完成时发送电子邮件?
【发布时间】:2016-10-22 14:48:54
【问题描述】:

我在 slurm 中使用 sbatch 运行了很多作业,如下所示:

#!/usr/bin/env python
#SBATCH --job-name=Python
#SBATCH --array=1-200
#SBATCH --mem=4000
#SBATCH --time=0-18:20
#SBATCH --mail-type=ALL
#SBATCH --mail-user=my_mail@yahoo.com

然而,似乎正在发生的事情是 slurm 正在向我发送每个数组的电子邮件。但是,我不希望 slurm 这样做,我只想在所有 slurm 阵列完成(或失败)运行时给我发送一封电子邮件。即当一个特定的工作(以及它的所有工作数组完成)。这可以在slurm中做到吗?

我正在阅读文档,它在--mail-type=<type> 下显示以下内容:

除非指定了 ARRAY_TASKS 选项,否则在作业中发送邮件通知 BEGIN、END 和 FAIL 应用于整个作业数组,而不是 为作业数组中的每个任务生成单独的电子邮件。

所以问题可能是我使用ALL 而不是BEGINENDFAIL?老实说,我只是对所有作业阵列都完成运行感兴趣,即使单个失败也可以。

【问题讨论】:

  • 你运行的是什么版本的 Slurm? 15.08.0pre3 中的行为发生了变化
  • @damienfrancois 如何查看版本?
  • scontrol version
  • @damienfrancois 我的 slurm 版本似乎是:slurm 16.05.4
  • 你可以试试BEGIN,END,FAIL而不是ALL,其中还包括REQUEUESTAGE_OUT

标签: slurm


【解决方案1】:

文件:

--邮件类型=

... 除非指定 ARRAY_TASKS 选项,否则关于作业 BEGIN、END 和 FAIL 的邮件通知将作为一个整体应用于作业数组,而不是为作业数组中的每个任务生成单独的电子邮件消息。 ...

https://slurm.schedmd.com/sbatch.html

希望这能回答你的问题。

【讨论】:

    猜你喜欢
    • 2016-11-04
    • 1970-01-01
    • 2013-11-25
    • 2016-03-26
    • 1970-01-01
    • 1970-01-01
    • 2017-11-10
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多