【发布时间】:2015-04-22 04:43:36
【问题描述】:
我正在编写一个非常小的脚本,可以将 latin-1 字符转换为 unicode(我完全是 Python 初学者)。
我试过这样的方法:
def latin1_to_unicode(character):
uni = character.decode('latin-1').encode("utf-8")
retutn uni
它适用于不特定于 latin-1 集的字符,但如果我尝试以下示例:
print latin1_to_Unicode('å')
它返回Ã¥ 而不是å。 æ 和 ø 等其他字母也是如此。
谁能解释一下为什么会这样? 谢谢
我的脚本中有 # -*- coding: utf8 -*- 声明,如果它对问题有任何影响的话
【问题讨论】:
标签: python utf-8 decode encode latin1