【发布时间】:2015-01-01 17:08:31
【问题描述】:
我使用 python 2.7 并且我有以下字符串:mystr = '\xde\x05\xd7\x05\xe9\x05\xd1\x05'
我想从中获取真正的 unicode 字符串:myuni = u'\u05de\u05d7\u05e9\u05d1'。
编码为“cp1255”。
我怎样才能完成这项工作?
谢谢!
【问题讨论】:
-
向我们展示你到目前为止所做的事情..
-
那不是CP1255编码的数据。鉴于您的预期输出,您会期望
'\xee\xe7\xf9\xe1'代替。您使用的是 UTF-16。 -
@qqvc 但它根本不起作用。例如: mystr.decode("cp1255") --> *** UnicodeDecodeError: 'charmap' codec can't decode byte 0xde in position 0: character maps to
-
@MartijnPieters 哇,原来如此! mystr.decode("utf16") 返回了我需要的!谢谢!
标签: python python-2.7 encoding decode