【发布时间】:2013-04-17 11:20:57
【问题描述】:
我有 unicode 字符串,我确定它是 UTF-8,但我无法解码。字符串是'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'。怎么解码?
【问题讨论】:
-
解码成什么——你想怎么用?
-
哦,我很笨 :) print u'\u0441\u0438\u0434\u0435\u043d\u044c\u044f' 给出正常的人类可读字符串。
-
绝对不是UTF8。
-
@glglgl,可以是哪种编码方式?
-
@RankoR 根本没有 - 它只是 Unicode。
\u用于转义 unicode 字符串中的 unicode 代码点(u''在 2.x 中,''在 3.x 中)。如果它们出现在字符串 (2.x) 中,则分别出现在字符串 (2.x) 中。 bytes 对象(3.x),它们可以被解码,如下面的答案所示。