【问题标题】:launch MPI cluster failed启动 MPI 集群失败
【发布时间】:2016-07-03 19:33:11
【问题描述】:

我尝试启动我的 MPI 集群。我已经在每个节点上用sudo ufw disable 禁用了防火墙。我已经设置了无密码连接,以便 pc0 可以通过 ssh 无密码连接 pc1 和 pc2。

ub0为主节点主机,ub1和ub2为从节点。

错误是:

pc0@ub0:~/Downloads/mpich-3.0.4/examples$ mpirun -n 10 -f servers ./cpi
[proxy:0:1@ub1] HYDU_sock_connect (./utils/sock/sock.c:140): unable to get host address for ub0 (1)
[proxy:0:1@ub1] main (./pm/pmiserv/pmip.c:189): unable to connect to server ub0 at port 36272 (check for firewalls!)
[proxy:0:2@ub2] HYDU_sock_connect (./utils/sock/sock.c:140): unable to get host address for ub0 (1)
[proxy:0:2@ub2] main (./pm/pmiserv/pmip.c:189): unable to connect to server ub0 at port 36272 (check for firewalls!)

服务器文件是:

ub0:2
pc1@ub1:2
pc2@ub2:2

我的操作系统是 Ubuntu 14.04 i386。 MPI是MPICH

现在,我不知道如何解决它。感谢您的帮助!

【问题讨论】:

    标签: ssh mpi mpich


    【解决方案1】:

    我没有在其他节点上将 IP 和主机名添加到 /etc/hosts 中。

    所以编辑/etc/hosts,并像这样添加ip和主机名:

    192.168.0.1 node1
    192.168.0.2 node2
    192.168.0.3 node3
    

    之后,将编译好的文件复制到其他节点对应的目录下。然后就可以正常工作了。

    【讨论】:

      猜你喜欢
      • 2011-04-04
      • 2015-01-23
      • 1970-01-01
      • 1970-01-01
      • 2014-11-22
      • 1970-01-01
      • 2018-09-04
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多