【发布时间】:2013-12-15 01:52:19
【问题描述】:
我正在尝试从包含由 ASCII 值 215 分隔的单词对的文件中读取。当我运行以下代码时:
f = open('file.i', 'r')
for line in f.read().split('×'):
print line
我得到一个看起来像垃圾的字符串。这是我的输入示例:
abashedness×N
abashment×N
abash×t
abasia×N
abasic×A
abasing×t
Abas×N
abatable×A
abatage×N
abated×V
abatement×N
abater×N
Abate×N
abate×Vti
abating×V
abatis×N
abatjours×p
abatjour×N
abator×N
abattage×N
abattoir×N
abaxial×A
这是上面代码运行后的输出:
z?Nlner?N?NANus?A?hion?hk?hhn?he?hanoconiosis?N
我的目标是最终将其读入元组列表或类似性质的内容中,但我无法将数据打印出来。
感谢大家的帮助。
【问题讨论】:
-
print repr(line)产生什么? -
没有 ASCII 值 215 这样的东西。它是一个在 ASCII 编码中没有意义的字节。
-
@user2357112:它甚至不是一个字节。
'×'是 utf-8 中的两个字节。
标签: python file input delimiter