【问题标题】:LSF - BSUB Running a script if the job is killedLSF - BSUB 如果作业被终止,则运行脚本
【发布时间】:2016-12-01 01:59:54
【问题描述】:
我正在使用 LSF,正在运行 bsub 命令。
我正在实现 -Ep 开关来运行 post exec 脚本。在作业被终止或达到内存限制、运行限制等之前,这非常有效。
有没有办法让作业检测到资源耗尽然后运行脚本?还是强制它运行脚本,即使它被杀死?
我想我的另一个选择是运行依赖于该作业的作业,该作业将在完成时运行“post exec”脚本。
有什么想法吗?
亲切的问候,
大剥皮者
【问题讨论】:
标签:
cluster-computing
job-scheduling
lsf
【解决方案1】:
从documentation,你应该看到你想要的行为。
执行后命令在作业完成后运行,无论
作业的退出状态。一旦关联了执行后命令
对于作业,即使作业失败,该命令也会运行。你不能
配置执行后命令只在特定条件下运行
条件。
我认为也许与 JOB_INCLUDE_POSTEXEC (lsb.params) 的交互可以解释差异,但从我的测试来看,post-exec 仍然在这两种情况下运行。我使用了 runlimit (bsub -W) 来触发 job kill。
是否有可能 post exec 正在运行,但提前退出?
您使用的是什么版本的 LSF? (mbatchd -V和sbatchd -V的输出是什么)