【发布时间】:2011-07-29 05:27:05
【问题描述】:
我需要从文件中逐行读取 100 GB(4 亿行)的数据。这是我当前的代码,但有什么有效的方法可以做到这一点。 我的意思是执行速度。
f = open(path, 'r')
for line in f:
...
f.close()
【问题讨论】:
-
你有一个 100 GB 的文件???
-
这几乎是最好的方法。
-
难以置信。如果它生成 100GB 文件,显然你的应用程序有问题:-)
-
仅 100GB 文件就应该得到 -1,但这是欢乐时光 :)
-
@Rest: 100GB 不一定是 -1。也许OP真的有那么多数据! (CERN 估计每天产生 40,000GB。)
标签: python