【发布时间】:2014-09-17 23:55:48
【问题描述】:
我对并行计算几乎一无所知,所以这个问题可能很愚蠢,可能无法做我想做的事。
我正在使用具有 40 个节点的 linux 集群,但是由于我不知道如何在 R 中编写并行代码,因此我仅限于使用一个。在这个节点上,我试图分析淹没内存的数据(大约 64GB)。所以我的问题不是缺乏计算能力,而是内存限制。
我的问题是,是否甚至可以使用一些 R 包(如 doSnow)进行隐式并行化以使用 2-3 个节点来增加 RAM 限制,或者我是否必须从地面重写脚本以使其显式并行化?
对不起,如果我的问题很幼稚,欢迎提出任何建议。
谢谢,
西蒙
【问题讨论】:
-
并行编写代码不会帮助您限制 RAM。不过,
bigmemory之类的软件包可以提供帮助。这真的取决于你的需要。您可以采样吗?你需要处理数据吗?我不确定我们是否有足够的信息。
标签: r memory-management parallel-processing cluster-computing