【发布时间】:2014-10-12 16:43:32
【问题描述】:
我一直在努力建立一个 5 个节点、200 个 CPU 集群,主要是因为 R 显然已将 NCONNECTIONS 设置为将最大值限制为 128。根据我读过的here,我需要更改参数并重建 R (大概在每个节点上?),但我找不到上面指定的目录或文件。
如何更改 NCONNECTIONS 并重建 R?
我正在运行 Linux 版本 2.6.32-279.el6.x86_64
【问题讨论】:
-
我认为这意味着您正在使用基于套接字的雪状集群,但是:(a) 对于具有大量内核的单个 CPU,您宁愿使用 parallel::mclapply 和朋友,因为它们不会产生单独的 R 实例,因此内存效率更高,并且更易于管理; (b) Rmpi 通常是一个更好的选择,例如,通信成本(数据到/从节点的移动)随着节点数量的对数而增加,而不是线性地,并且不消耗 R 的套接字!。
-
@MartinMorgan 你是对的,但我认为我们使用的术语不同——我有 5 台机器,每台机器有 40 个处理器,我正在尝试运行大量非常小的作业需要并行性(可以独立运行)。对于这样的问题,您有什么建议?
-
如果你使用snow而不是parallel,你可以使用makeMPIcluster而不是makePSOCKcluster来创建集群以避免socket连接限制。