【发布时间】:2021-02-20 01:20:37
【问题描述】:
我问了一个问题here,关于如何将一个非常大的文件读入python,我得到了一个基于zip_longest的回复。
问题是这个解决方案非常慢 - keras 的 model.predict 需要 >2 小时来处理文件中的 200,000 行,当文件直接加载到内存中时通常需要
后来我在 pandas 中找到了分块功能,但我不明白如何加载文件块,重塑数据然后使用这些方法使用它,我也不知道这是否会读取和使用超大文件中数据的最快方式。
欢迎任何对此问题的快速解决方案。
【问题讨论】:
标签: python pandas dataframe memory chunking