【发布时间】:2014-11-30 05:32:08
【问题描述】:
在第一个实例之后重复行 ID(奇怪地放置在第 8 列,即行 [7])时,我想将这些行写入第二个文件。我尝试过的代码非常慢——它是一个 40 列的 CSV,大约有一百万行。这就是我所拥有的:
def in_out_repsplit(inf, outf1, outf2):
outf1 = csv.writer(open(outf1, 'wb'), delimiter=',', lineterminator='\n')
outf2 = csv.writer(open(outf2, 'wb'), delimiter=',', lineterminator='\n')
inf1 = csv.reader(open(inf, 'rbU'), delimiter=',')
inf1.next()
checklist = []
for row in inf1:
id_num = str(row[7])
if id_num not in checklist:
outf1.writerow(row)
checklist.append(id_num)
else:
outf2.writerow(row)
【问题讨论】:
标签: python python-2.7 csv