【发布时间】:2016-11-25 07:21:40
【问题描述】:
如何从我的工作中监控每个正在运行的线程/进程?基本上,我希望看到类似于top 或ps 给出的输出:例如每个线程的 CPU 使用情况、进程的内存使用情况等。
在 SLURM 中有命令sstat,我可以在其中查看job stats。例如,它允许我检查提交的作业请求的总 CPU 时间(用户+系统)、RSS 甚至 CPU 频率。它不包括详细的每个进程(或线程)信息。
【问题讨论】:
标签: performance monitoring hpc slurm