【发布时间】:2021-02-25 10:29:50
【问题描述】:
我的问题与任何特定代码无关。相反,它是一般的。我目前正在 Python 中运行 MPI 并行代码,偶尔会遇到分段错误。每当发生段错误时,我都会收到一条错误消息(如下所示)并且代码退出 -
===================================================================================
= BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES
= PID 173577 RUNNING AT whatever_node
= EXIT CODE: 139
= CLEANING UP REMAINING PROCESSES
= YOU CAN IGNORE THE BELOW CLEANUP MESSAGES
===================================================================================
我的问题是 - 我如何确定导致此错误的排名?退出消息仅提及 PID。我可以用它来找出错误的排名吗?
PS : 上述代码不是我自己的 - 我只是运行它并报告错误。
【问题讨论】: