【问题标题】:How to get stats for individual process/thread in SLURM?如何获取 SLURM 中单个进程/线程的统计信息?
【发布时间】:2016-11-25 07:21:40
【问题描述】:

如何从我的工作中监控每个正在运行的线程/进程?基本上,我希望看到类似于topps 给出的输出:例如每个线程的 CPU 使用情况、进程的内存使用情况等。

在 SLURM 中有命令sstat,我可以在其中查看job stats。例如,它允许我检查提交的作业请求的总 CPU 时间(用户+系统)、RSS 甚至 CPU 频率。它不包括详细的每个进程(或线程)信息。

【问题讨论】:

    标签: performance monitoring hpc slurm


    【解决方案1】:

    要获取进程级信息,您可以激活AcctGatherProfileType/hdf5 插件,该插件允许您将大量指标收集到打包在HDF5 文件中的时间序列中。请参阅此page 了解更多信息。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-01-23
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-08-11
      相关资源
      最近更新 更多