【问题标题】:Converting a scraped unicode string into regular Python strings [duplicate]将抓取的 unicode 字符串转换为常规 Python 字符串 [重复]
【发布时间】:2017-04-11 15:55:50
【问题描述】:

这个问题让我发疯了。我正在使用请求模块抓取网页。我得到的字符串是这样的:

x = "\nM\\u00fcnster - Melbourne - New York\n\\ud83d\\udc7b kaptenandson"

我似乎无法让它正常输出,无论是在终端上还是在其他任何地方(输出文件等)。文本包含一个变音符号和两个表情符号,但我无法使用它 - 让我发疯。

此外,我已经阅读了有关 unicode 的资源,但在这种情况下它们没有任何帮助。还有其他我可以阅读的 Python 中的 unicode / 编码教程吗?

【问题讨论】:

    标签: python unicode character-encoding


    【解决方案1】:

    想通了!我得到的字符串是 javascript 转义的。在这里指出正确的答案:

    How do I decode escaped unicode javascript code in Python?

    【讨论】:

    • 不鼓励仅链接的答案。我改为关闭为副本。
    • 谢谢@MarkTolonen!
    猜你喜欢
    • 2016-12-10
    • 1970-01-01
    • 2011-05-23
    • 2016-02-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多