【发布时间】:2016-10-22 14:48:54
【问题描述】:
我在 slurm 中使用 sbatch 运行了很多作业,如下所示:
#!/usr/bin/env python
#SBATCH --job-name=Python
#SBATCH --array=1-200
#SBATCH --mem=4000
#SBATCH --time=0-18:20
#SBATCH --mail-type=ALL
#SBATCH --mail-user=my_mail@yahoo.com
然而,似乎正在发生的事情是 slurm 正在向我发送每个数组的电子邮件。但是,我不希望 slurm 这样做,我只想在所有 slurm 阵列完成(或失败)运行时给我发送一封电子邮件。即当一个特定的工作(以及它的所有工作数组完成)。这可以在slurm中做到吗?
我正在阅读文档,它在--mail-type=<type> 下显示以下内容:
除非指定了 ARRAY_TASKS 选项,否则在作业中发送邮件通知 BEGIN、END 和 FAIL 应用于整个作业数组,而不是 为作业数组中的每个任务生成单独的电子邮件。
所以问题可能是我使用ALL 而不是BEGIN、END 或FAIL?老实说,我只是对所有作业阵列都完成运行感兴趣,即使单个失败也可以。
【问题讨论】:
-
你运行的是什么版本的 Slurm? 15.08.0pre3 中的行为发生了变化
-
@damienfrancois 如何查看版本?
-
scontrol version -
@damienfrancois 我的 slurm 版本似乎是:
slurm 16.05.4 -
你可以试试
BEGIN,END,FAIL而不是ALL,其中还包括REQUEUE和STAGE_OUT?
标签: slurm