【问题标题】:Python decode "\u041b" string [duplicate]Python解码“\ u041b”字符串[重复]
【发布时间】:2013-04-17 11:20:57
【问题描述】:

我有 unicode 字符串,我确定它是 UTF-8,但我无法解码。字符串是'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'。怎么解码?

【问题讨论】:

  • 解码成什么——你想怎么用?
  • 哦,我很笨 :) print u'\u0441\u0438\u0434\u0435\u043d\u044c\u044f' 给出正常的人类可读字符串。
  • 绝对不是UTF8。
  • @glglgl,可以是哪种编码方式?
  • @RankoR 根本没有 - 它只是 Unicode。 \u 用于转义 unicode 字符串中的 unicode 代码点(u'' 在 2.x 中,'' 在 3.x 中)。如果它们出现在字符串 (2.x) 中,则分别出现在字符串 (2.x) 中。 bytes 对象(3.x),它们可以被解码,如下面的答案所示。

标签: python unicode


【解决方案1】:

你可以使用aString.decode('unicode_escape'),它将一个unicode格式的字符串转换为unicode对象

>>> u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'
u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'
>>> '\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'.decode('unicode_escape')
u'\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'
>>>

你的情况

>>> print '\u041b\u0435\u0433\u043a\u043e\u0432\u044b\u0435'.decode('unicode_escape')
Легковые
>>> 

【讨论】:

    猜你喜欢
    • 2011-06-21
    • 1970-01-01
    • 2023-03-13
    • 2015-05-31
    • 2016-09-18
    • 2016-08-19
    • 1970-01-01
    • 2019-08-26
    • 2023-04-04
    相关资源
    最近更新 更多