【发布时间】:2015-05-09 05:49:08
【问题描述】:
这个问题在某种程度上与"Concatenate a large number of HDF5 files"有关。
我有几个巨大的 HDF5 文件(压缩后约 20GB),无法容纳 RAM。它们中的每一个都存储了几个相同格式的pandas.DataFrames,并且索引不重叠。
我想将它们连接成一个 HDF5 文件,其中所有 DataFrame 都正确连接。一种方法是逐块读取它们中的每一个,然后保存到单个文件中,但确实需要相当长的时间。
是否有任何特殊的工具或方法可以在不遍历文件的情况下做到这一点?
【问题讨论】:
标签: python pandas hdf5 pytables