【发布时间】:2013-12-18 02:02:39
【问题描述】:
我有一个相当大的 HDF5 文件,其中存储(除其他外)一个包含 150 名参与者的眼动追踪数据的大型时间序列数据集。
In [20]: f['data_collection/events/eyetracker/BinocularEyeSampleEvent/']
Out[21]: <HDF5 dataset "BinocularEyeSampleEvent": shape (8297323,), type "|V178">
我无法将所有这些都读入内存,因为它太大了,但是我如何才能读到其中的一部分呢?
我想做这样的事情 - 当时读取一个参与者(参与者的列名是“名称”),执行一些操作并保存到一个较小的数据框:
for name in f['data_collection/events/eyetracker/BinocularEyeSampleEvent/'][name]:
df = f['data_collection/events/eyetracker/BinocularEyeSampleEvent/']
...
...
我该怎么做?我正在使用 h5py 读取 HDF5 文件。
/马丁
【问题讨论】:
标签: python split dataset hdf5 dataframe