【发布时间】:2017-11-13 14:55:35
【问题描述】:
我在保存 pandas.DataFrame(1 440 000 000 行)时遇到问题。
据我在 API 中看到的,存储(然后加载)数组的唯一可用选项是 CSV 或 pickle。
以 pickle 格式保存会以一个神秘的异常结束 (SystemError: error return without exception set),而以 CSV 格式保存即使压缩也是浪费空间(2 字节长 np.float16 比 ASCII 编码的值效率高得多)。
如何以可加载、内存高效(包括磁盘空间)的格式存储我的数据帧?
【问题讨论】:
标签: python python-2.7 python-3.x pandas dataframe