【发布时间】:2015-04-30 10:21:56
【问题描述】:
我使用以 Python .npz 格式存储的数组。我有很多这样的文件,它们都共享相同的公共结构:文件名my_file_var1_var2_var3.npz 包含以下项目(所有数组都是 32 位浮点数):
- 二维数组(N=11,Ns=2000)
- 一个二维数组 (12, N )
- 二维数组 (300, N)
- 一个二维数组(300,Ns)
- 一个浮点数
- 一个整数
拥有超过 1000 个文件非常烦人,而且每个文件最终都占用了大约 4Mb。我在想最好将它们转移到一个容器中,比如 HDF5/Pytables 或类似的。不同的数组只是数组,没有优先排序或任何东西(它们实际上是矩阵或将被操作的向量堆栈)。每个文件名的所有数组都需要同时在一起。
关于什么格式可以更好地检索与var1、var2 和var3 关联的数组,是否有任何建议,即便携且存储高效
【问题讨论】: