【发布时间】:2013-12-01 11:17:16
【问题描述】:
我有来自 csv 的数据,它有几千列和一万(左右)行。在每一列中,数据的类型相同,但不同的列具有不同类型的数据*。以前我一直在从 numpy 中提取数据并存储在磁盘上,但是速度很慢,尤其是因为通常我想加载列的一部分而不是全部。
我想使用 pytables 将数据放入 hdf5,我的第一种方法是将数据放入单个表中,每个 csv 列一个 hdf5 列。不幸的是,这不起作用,我认为是因为 512(软)列限制。
存储这些数据的明智方法是什么?
* 我的意思是,文本转换后的数据类型。
【问题讨论】:
标签: python numpy hdf5 pytables