【发布时间】:2016-11-22 15:30:15
【问题描述】:
我有以下熊猫数据框:
import pandas as pd
df = pd.read_table('fname.dat')
所以,我创建/打开一个现有的 HDFStore 文件:
store = pd.HDFStore('store.h5')
要索引列的子集,我只需使用
store.append('key_name', df, data_columns=['colA','colB','colZ'])
显然,HDFStore.append()默认以table 格式保存 pandas 数据帧。但是,看起来它实际上是一个“frame_table”对象:
store
输出
/key_name frame_table (typ->appendable,nrows->3254334,ncols->14,indexers->[index],dc->[colA, colB, colZ])
如何有效地索引这个对象?
通常情况下,查询将是
result = [row for row in table.where('colA==22 & colB==45')]
但是对于frame_table 对象会这样做吗?
【问题讨论】:
标签: python pandas hdf5 pytables h5py