【问题标题】:How to use MPI_Info_set with MPI_Comm_spawn in MPICH如何在 MPICH 中使用 MPI_Info_set 和 MPI_Comm_spawn
【发布时间】:2019-06-28 19:08:51
【问题描述】:

我需要在集群上使用 MPI spawn。为此,我知道我需要使用 MPI_Info_set 来指定节点将运行生成的进程。我试过MPI_Info_set(info, "add-host","node1,node2"),但它不起作用。

下面,我提供一个生成代码的小例子:

MPI_Info info;
MPI_Info_create(&info);
MPI_Info_set(info,"add-host","node1,node2");
MPI_Comm_spawn("./mpiworker", MPI_ARGV_NULL,
               dynamic_procs,
               info, 0, MPI_COMM_WORLD,
               &intercomm,
               MPI_ERRCODES_IGNORE);

还有什么我可以用的吗?

【问题讨论】:

    标签: mpi cluster-computing spawn mpich


    【解决方案1】:

    参数add-host可能来自OpenMPI(man page),MPICH不支持。

    对于 MPICH,请尝试以下方法之一:

    • host - 为我工作,
    • hosts - 应该可以工作,但是,它似乎在我当前使用的版本中被破坏了,MPI 在作为参数值传递的第一个节点处生成所有进程;如果您的情况也发生这种情况,我建议使用 MPI_Comm_spawn_multiple 为每个进程手动分配主机。

    另外,我不知道如何找到所有受支持参数的列表 - 我认为 MPICH 人不太注意保持文档的完整性。

    【讨论】:

      【解决方案2】:

      这对我有用,而不仅仅是MPI_Comm_spawn。以下代码将为每个节点生成 1 个进程。通过扩展下面输入的维度,我可以为每个节点生成更多进程。

      MPI_Info info[2];
      
      MPI_Info_create(&info[0]);
      MPI_Info_set(info[0],"host","node1");
      
      MPI_Info_create(&info[1]);
      MPI_Info_set(info[1],"host","node2");
      
      char *cmds[2] = { "./mpiworker", "./mpiworker" };
      int np[2] = { 1, 1 };
      int errcodes[2];
      
      MPI_Comm_spawn_multiple( 2, cmds, MPI_ARGVS_NULL, np, info, 0, MPI_COMM_WORLD, &intercomm, errcodes );
      
      //Below parallel code follows
      ...
      

      以上内容是在 Ubuntu-bionic 上使用 MPICH 版本:3.3a2 进行测试的。

      我的示例基于以下page。如果我找到更优雅的方式,我会重新发布。

      【讨论】:

        猜你喜欢
        • 2013-01-21
        • 2012-09-12
        • 2021-04-21
        • 2015-04-15
        • 2017-08-28
        • 1970-01-01
        • 2018-04-24
        • 2018-05-31
        • 1970-01-01
        相关资源
        最近更新 更多