【发布时间】:2015-01-25 20:13:06
【问题描述】:
我遇到了这个website,它显示了 Unicode 表。
当我打印字母“ספר”时:
>>> x = 'ספר'
>>> x
'\xd7\xa1\xd7\xa4\xd7\xa8'
我得到了这个字符'\xd7\xa1\xd7\xa4\xd7\xa8'。
我认为 python 用 utf-8 Unicode 编码单词“ספר”,因为它是默认值,对吧?
但是当我运行这段代码时:
>>> x = u'ספר'
>>> x
u'\u05e1\u05e4\u05e8'
我得到了这个u'\u05e1\u05e4\u05e8',这是一个 Unicode 点,对吧?
如何从 utf8-literal 转换为 Unicode 点?
【问题讨论】:
-
注意字节串(上面的第一个
x赋值)和Unicode点串(第二个x赋值)对于UTF-8中的符号是等价的:@ 987654322@
标签: python python-2.7 unicode utf-8