【发布时间】:2021-04-25 10:19:13
【问题描述】:
在我对如此结构化的 CPU 集群进行了多次尝试之后,我给你写信:
144 个标准计算节点 2× AMD EPYC 7742,2× 64 核,2.25 GHz 256 (16×16) GB DDR4, 3200 MHz InfiniBand HDR100 (Connect-X6) 操作系统的本地磁盘(1× 240 GB SSD) 1 TB NVMe
现在,由于我的 core-h 在这里有限,我想尽可能地提高性能。 我正在使用以下提交脚本进行一些基准测试:
#!/bin/bash -x
#SBATCH --account=XXXX
#SBATCH --ntasks=256
#SBATCH --output=mp-out.%j
#SBATCH --error=mpi-err.%j
#SBATCH --time=24:00:00
#SBATCH --partition=batch
srun ./myprogram
我正在运行的程序是 Gromacs2020 (MPI),这是一个执行分子动力学模拟的软件。
在机器手册中我读到了这些键:
--ntasks
--ntasks-per-node
--cpu-per-node
但是,考虑到最近的技术,我的表现平平。确实,在一个 5 年老的集群中,我在使用可比资源的情况下获得了更好的性能。
那么,您是否设想将这些关键字很好地组合以最大限度地提高性能并避免核心-h 浪费? 我的系统大小约为 100K 原子(如果有帮助的话)。
非常感谢任何反馈,
期待听到您的意见。
最好的问候
VG
【问题讨论】:
标签: performance hpc slurm scientific-computing