【发布时间】:2017-01-16 19:40:51
【问题描述】:
我有一个包含数百万行的 100GB csv 文件。例如,我需要在 pandas 数据框中一次读取 10,000 行并将其分块写入 SQL 服务器。
我按照http://pandas-docs.github.io/pandas-docs-travis/io.html#iterating-through-files-chunk-by-chunk 的建议使用了 chunksize 和 iteartor,并且遇到了许多类似的问题,但我仍然遇到内存不足的错误。
您能否建议一个代码来迭代地读取 pandas 数据帧中非常大的 csv 文件?
【问题讨论】:
标签: python csv pandas dataframe iterator