【发布时间】:2018-07-01 02:25:40
【问题描述】:
我的文件中有超过 5000 万行。每行都以一些特定的两个字符代码开头。示例文件行是:
AB1357 0000 -9999 XFAB ...
AB1358 0000 -9999 XABC ...
BC 3233 1322 -8638 SCDR ...
如您所见,每行的前两个字符是一个代码。我必须根据他所在行的 "code" 对每一行进行一些处理。现在我正在逐行处理文件,这需要很多时间。有什么办法可以优化这个吗?我正在使用 Python。
注意:我已经拥有所有可能的 60 个代码的列表。
【问题讨论】:
-
既然你显然想处理每一行,我不确定你对这个问题的意图是什么。您需要处理每一行才能处理每一行
-
你的线条大小都一样吗?无论如何,如果您需要完整阅读文件所必须的所有信息...
-
由于我在处理后将所有相同的代码行写入特定文件,我想知道是否有任何方法可以将具有相同代码的行分组并立即处理它们?
-
行大小取决于代码,我需要行中的所有信息
-
这可能是 X-Y 问题。听起来代码很慢,不是文件的读取。
标签: python python-3.x file