【发布时间】:2014-05-14 23:08:53
【问题描述】:
由于 C 扩展中的一些错误,我正在获取带有 str 实例的 unicode 数据,或者换句话说,str 根本没有编码和 unicode 文字。
因此,例如,这是一个有效的 unicode 文字
>>> u'\xa1Se educado!'
UTF-8 编码的 str 将是:
>>> '\xc2\xa1Se educado!'
但是,我得到一个带有 unicode 文字的 str:
>>> '\xa1Se educado!'
我需要从中创建一个 unicode 实例。使用 unicode() 不起作用,因为它需要编码。我认为''.join(unichr(ord(x)) for x in s) 可以满足我的需要,但它真的很难看。必须有更好的解决方案。有什么想法吗?
【问题讨论】:
-
您使用的 Python 版本是什么?造成问题的扩展是什么?你能在那里纠正吗?
-
Python 2.7。扩展名并不相关。
标签: python python-2.7 unicode encoding unicode-literals