【发布时间】:2011-01-25 04:19:28
【问题描述】:
我需要在 python 中将文件从 latin1 转换为 utf-8 的最快方法。文件很大~2G。 (我正在移动数据库数据)。到目前为止我有
import codecs
infile = codecs.open(tmpfile, 'r', encoding='latin1')
outfile = codecs.open(tmpfile1, 'w', encoding='utf-8')
for line in infile:
outfile.write(line)
infile.close()
outfile.close()
但它仍然很慢。转换需要整个迁移时间的四分之一。
如果它比原生 python 代码更快,我也可以使用 linux 命令行实用程序。
【问题讨论】:
标签: python