【问题标题】:Torque/PBS can not find munge.socket.2扭矩/PBS 找不到 munge.socket.2
【发布时间】:2016-09-16 00:24:40
【问题描述】:

我正在尝试为我的 MPI 课程创建一个虚拟集群,这样我就可以在家工作,而不是整天呆在大学实验室。我现在 2 天不知道如何用 munge 解决这个问题。

我遇到的问题的输出是这样的

[root@localhost lumx]# qmgr -c "set server acl_hosts = mars"
munge_encode failed: Failed to access "/var/run/munge/munge.socket.2": No such file or directory (6)
Unable to communicate with localhost(127.0.0.1)
Communication failure.
qmgr: cannot connect to server  (errno=15009) munge executable not found, unable to authenticate

我的主机文件如下所示

127.0.0.1    localhost localhost.localdomain localhost4 localhost4.localdomain4 
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
127.0.0.1 mpimaster localhost.localdomain localhost

我试图尽可能多地阅读,最终我得到了这些指南,Getting started with Open MPI on FedoraInstalling Torque/PBS job scheduler on Ubuntu 14.04 LTSTORQUE Arch Linuxhttp://juanjose.garciaripoll.com/fedora-cluster/5-torque-pbs-queue

【问题讨论】:

    标签: cluster-computing virtual fedora pbs torque


    【解决方案1】:

    我解决了。我只需要强制它启动并使用系统日志,因为现在存在一些权限问题。

    我使用的命令是

    munged --force --syslog
    

    【讨论】:

      【解决方案2】:

      对于 Opensuse Leap 15.X,您需要通过以下方式启动 munge 服务

      sudo service munge start
      
      sudo service munge status
      

      如果服务显示为活动状态,您现在可以输入以下内容进行验证:

      munge -n  
      

      这应该会返回如下结果:

      MUNGE:AwQFAAAHiPEv+E6Ezy2HVHUwo5PZ2fkbbr4yP7pZZA9Yo6BWQdAFGVRNkhNbRkvd9zNAvnpg0iQzkjg+WW6HdIix48nKrA0QnjispII4RoT1UqZLh7ybIl5/WIvd3ta85v1KV8A=:
      

      【讨论】:

        猜你喜欢
        • 2014-02-10
        • 2011-11-01
        • 1970-01-01
        • 1970-01-01
        • 2012-10-09
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2017-08-20
        相关资源
        最近更新 更多