【发布时间】:2020-03-08 18:46:40
【问题描述】:
目前,我正在处理一个很大的文件(大约 45GB) 我正在尝试使用 pandas read_csv 函数加载文件,但是,加载文件需要很长时间。有没有办法加快这个过程?
我正在考虑将文件分成几块并使用多处理加载它们。
或者有更好的方法吗?
编辑:我认为在 read_csv() 中使用 chunksize 参数是最好的选择
【问题讨论】:
标签: python pandas multithreading multiprocessing