【发布时间】:2020-05-15 04:43:48
【问题描述】:
我编写了一个代码,它使用 readlines() 逐行读取一个非常大的 CSV 文件。我使用全局变量调用该函数并访问该变量以搜索特定单词并计算它在文件中出现的次数。
def init(filename):
global lines
with open(filename) as file:
lines = file.readlines()
def total():
males = 0
females = 0
for i in range(0, len(lines)):
current_line = lines[i].split(",")
if current_line[5] == 'M\n':
males += 1
elif current_line[5] == 'F\n':
females += 1
total_dict = {"Gender": {"M": males, "F": females}}
return total_dict
由于某种原因,此代码适用于较小的文件,但我似乎无法使用超大文件。
【问题讨论】:
-
你能解释一下处理大文件时到底出了什么问题吗?