【发布时间】:2014-03-29 17:05:06
【问题描述】:
a='ÿþ"[]B[]a[]l[]a[]n[]c[]e'
注意:左方括号和右方括号代表这个方符号。但是,我无法将方形符号复制并粘贴到此处以准确显示我正在查看的内容。
“a”中的字符代表我下载的文件的开头。它是一个 csv 文件,unicode。如何删除这些不需要的字符?我只想从a中恢复“平衡”这个词。
我用来简单这个例子的代码:
fi = open(path+fn, 'r')
data = fi.read()
fi.close()
print(data)
fn 是一个 csv 文件。
试过了:
data=data.encode()
d=replace('\x00','')
产生错误:
TypeError: expected bytes, bytearray or buffer compatible object
【问题讨论】:
-
我不懂 Python,但 ÿþ 是一个 utf-16 BOM,所以在打开文件时寻找一种指定编码的方法
标签: python csv python-3.x unicode