【发布时间】:2016-11-23 03:59:42
【问题描述】:
我有一个大约 90 GB 的 gzip。这完全在磁盘空间内,但远大于 RAM。
如何将其导入熊猫数据框?我在命令行中尝试了以下操作:
# start with Python 3.4.5
import pandas as pd
filename = 'filename.gzip' # size 90 GB
df = read_table(filename, compression='gzip')
然而,几分钟后,Python 以Kill 9 关闭。
定义数据库对象df后,我打算将它保存到HDF5中。
这样做的正确方法是什么?我怎样才能使用pandas.read_table() 来做到这一点?
【问题讨论】:
标签: python pandas dataframe gzip hdf5