【发布时间】:2020-07-21 21:06:31
【问题描述】:
节点中有几个作业,想看看我的作业在那里运行。由于内存问题,节点被我(用户)占用为睡眠(只是拿了没有实际作业的节点),qstat显示运行状态但实际上没有作业在运行。我需要使用 ssh 检查。
qstat如下所示
- job-ID 优先名用户状态提交/在队列槽 ja-task-ID 开始
- 3508392 0.60500 joonho0 joonho r 04/09/2020 12:17:03 skylake@node02 36
- 3508393 0.60500 joonho1 joonho r 04/09/2020 12:17:03 skylake@node22 36
- 3509074 0.00000 amplong16 joonho qw 04/09/2020 13:22:20 36
在我的审判中,
- qstat | awk '/@/ {打印 $8}' |剪切 -d@ -f2
打印
- node02
- node22
我想通过管道将这些传递给 ssh 然后我可以使用
- ssh node02 ps aux | grep amp_run.py
我可以在哪里检查作业“amp_run.py”是否正在运行。
但以下失败,
- qstat | awk '/@/ {打印 $8}' |切-d@ -f2 | xargs ssh ps 辅助 | grep amp_run.py
有没有办法在命令行中执行此操作,而不是编写脚本?或者有什么其他建议来检查被占用节点而不是所有节点中正在运行的作业?
【问题讨论】: