【发布时间】:2018-01-05 20:00:12
【问题描述】:
我有 100 个熊猫数据帧存储在我计算机目录中的 .pkl 文件中。我想浏览所有数据帧并将它们全部保存在 1 个 HDF5 文件中。我计划将所有数据帧保存在 1 个 pickle 文件中,但我听说 HDF5 明显更好更快。
首先我是这样做的:
path = '/Users/srayan/Desktop/data/Pickle'
df = pd.DataFrame()
for filename in glob.glob(os.path.join(path, '*.pkl')):
newDF = pd.read_pickle(filename)
df = df.append(newDF)
df.to_pickle('/Users/srayan/Desktop/data/Pickle/Merged.pkl')
但最长的部分是将庞大的数据框转换为泡菜。有什么方法可以将这个大数据帧放入 HDF5 中,或者有什么更好的建议可以将所有 pickle 文件合并到 1 个可以保存的数据帧中?
【问题讨论】:
标签: python pandas dataframe pickle hdf5