【发布时间】:2011-09-23 11:30:12
【问题描述】:
我正在为大型网格数据集寻找一种良好的存储格式。该应用程序是气象学,我们更喜欢该领域中常见的格式(以帮助与他人交换数据)。我不需要处理特殊的数据结构,应该有 Fortran API。我目前正在考虑 HDF5、GRIB2 和 NetCDF4。
这些格式在数据压缩方面的比较如何?他们的主要局限是什么?学习曲线有多陡峭?还有其他值得研究的存储格式吗?
我没有找到大量概述这些格式的差异和优缺点的材料(有一个相关的 SO thread 和 a presentation 比较 GRIB 和 NetCDF)。
【问题讨论】:
-
有一个很好的用于 HDF5 的 Fortran 包装器,称为 FUTILS - 这大大简化了 HDF5 文件的编写,但代价是能够使用并行 HDF5 IO。
标签: compression file-format data-storage hdf5 netcdf