【发布时间】:2017-02-23 16:45:08
【问题描述】:
免责声明:我有大约 3 个月的编程经验......所以对于任何愚蠢的问题提前道歉。
我有一个 9GB 的 CSV 文件,我正在尝试使用 Python 2.7 进行清理
我需要删除/替换/剥离您想要调用的任何内容....所有“\”实例散布在数据中。
这是我迄今为止想出的:
#Python 2.7
csvfileIn = open("dataexample.csv", "r")
csvOut = open("dataexample2.csv", "w")
for i, row in enumerate(csvfileIn.readline()):
row = row.replace("\"", "")
csvOut.write(row)
csvOut.close()
这不会像我希望的那样遍历 CSV 文件。 有人建议我使用 readline() 而不是 readlines(),因为文件太大了。
我会附上示例数据文件,但我没有足够的街头信誉来附上文件。我想我发布的最后一个问题很愚蠢,所以我失去了一些代表点。 screenshot of example data
感谢您的帮助!
更新/固定代码
#Python 2.7
csvfileIn = open("dataexample.csv", "r")
csvOut = open("dataexample2.csv", "w")
for i, row in enumerate(csvfileIn):
row = row.replace("\\", "")
csvOut.write(row)
csvOut.close()
csvfileIn.close()
【问题讨论】:
-
enumerate(csvfileIn.readline())只会枚举文件的第一行。文件是可迭代的,所以只需使用enumerate(csvfileIn)。
标签: python python-2.7 csv