【问题标题】:Condor on Win7: connection issue (Errno 10054)Win7 上的 Condor:连接问题 (Errno 10054)
【发布时间】:2014-08-05 04:30:01
【问题描述】:

我已经根据本指南在几台 Win7(32/64 位)计算机上安装了 condor 8.2.0:http://www.slideshare.net/gtelzur/condor8-win-install 所有服务都在同一台机器上运行,因此我排除了物理网络中断。

每当创建/提交作业时,它都处于空闲模式。详细查看日志文件揭示了以下问题(ShadowLog):

07/07/14 08:10:47 (1.1) (PID1): **** condor_shadow (condor_SHADOW) pid PID1 EXITING WITH STATUS 107
07/07/14 08:10:47 (1.0) (PID2): condor_read() failed: recv(fd=540) returned -1, errno = 10054 , reading 5 bytes from startd slot1@mycomputer.mydomain.local.
07/07/14 08:10:47 (1.0) (PID2): IO: Failed to read packet header
07/07/14 08:10:47 (1.0) (PID2): Can no longer talk to condor_starter <192.168.25.120:56186>

我找不到有关 ID 为 10054 的 IO 异常的更多详细信息。除此之外,如果我搜索“Condor IO:无法读取数据包标头”,Google 不会给我有用的提示。

你知道什么可以解决这个问题吗?

【问题讨论】:

    标签: io condor


    【解决方案1】:

    我遇到了同样的问题,当我在C:\Condor(它在D:\Condor)中重新安装 Condor 时,它得到了解决。

    请注意,在使用 Condor 8.2.1 时,我遇到了一个不相关的问题:我必须编辑 condor_config 文件并删除 CONDOR_HOST = $$(FULL_HOSTNAME) 行中的一个 $,否则会出现解析错误。

    【讨论】:

    • 我会尝试将它安装到 C:\Condor 而不是其他驱动器。除此之外,我已经检查了配置并且设置正确(CONDOR_HOST = $(FULL_HOSTNAME))。
    【解决方案2】:

    当你看到

    condor_read() failed: .... reading 5 bytes from .....

    在其中一个日志文件中,这通常意味着连接的另一端挂断,因此您应该在日志文件中查找转换的另一端。在这种情况下,这将是 mycomputer.mydomain.local 上的 StarterLog.slot1(或者可能只是 StarterLog,如果问题发生得非常频繁早期的)。

    通常当一个守护进程挂断时,挂断的原因在日志中,而问题往往是对话的另一方未获得授权。查看与 ALLOW_* 匹配的配置值以查看授权内容。

    【讨论】:

      猜你喜欢
      • 2011-03-04
      • 1970-01-01
      • 2014-10-18
      • 2011-11-08
      • 1970-01-01
      • 1970-01-01
      • 2012-02-07
      • 1970-01-01
      • 2012-07-14
      相关资源
      最近更新 更多