【发布时间】:2013-10-11 14:41:21
【问题描述】:
我想从 R 中读取和写入单个 netCDF-4 文件。该文件将被许多节点进程同时访问(大约 100 个用于开发,大约 1000 个用于生产)。
从 R 中访问 netCDF 中并行 I/O 功能的最佳方式是什么?
我发现了什么:
- 从 Unidata 页面看来,我需要做的就是在启用并行功能的情况下进行编译 (
--enable-parallel)。这真的是我需要做的吗? - 我在 ncdf4 包描述中找不到任何关于并行 io 的提及。
- 鉴于 I/O 是我的计算中的瓶颈,关于如何优化我的计算的任何提示 - 是否存在在计算期间(例如,本地)写入多个文件并稍后合并文件更好的情况(例如使用nco)?
【问题讨论】:
-
你有支持并行 I/O 的硬件和文件系统吗?
-
@HighPerformanceMark 是的。一个是 RedHat Rocks 集群 (info here),另一个是 Dell PowerEdge 集群 (info here)
标签: r io parallel-processing netcdf nco