【问题标题】:how to decode bson in cyrillic?如何用西里尔文解码 bson?
【发布时间】:2017-04-21 12:31:15
【问题描述】:

我有一个 bson {'room': '55d5928a4d02f4a55007344c', 'sender': '55af71054d02f4571abe1f1f', 'message': 'Ð\x9fÑ\x80ивеÑ\x82! Ð\x97деÑ\x81Ñ\x8c вÑ\x8b можеÑ\x82е задаÑ\x82Ñ\x8c вопÑ\x80оÑ\x81 и бÑ\x8bÑ\x81Ñ\x82Ñ\x80о полÑ\x83Ñ\x87иÑ\x82Ñ\x8c оÑ\x82веÑ\x82 на него.', 'created_at': 1440146705.612493, '_id': ObjectId('55d6e5114d02f49f998a08b5')} 我想在 python3 中从中获取“消息”。如何解码?

我已经试过了 raw.encode().decode('utf8') raw.encode().decode('cp1251') 但它给出了不好的结果 'Привет! Здесь вы можете задать вопрос ГђВё быстро получить ответ ГђВЅГђВ° него.'

【问题讨论】:

    标签: python-3.x parsing python-3.5 bson cyrillic


    【解决方案1】:

    这是 UTF-8,它被错误地解码为 Latin-1 (ISO 8859-1)。

    >>> raw.encode('l1').decode()
    "{'room': '55d5928a4d02f4a55007344c', 'sender': '55af71054d02f4571abe1f1f', 'message': 'Привет! Здесь вы можете задать вопрос и быстро получить ответ на него.', 'created_at': 1440146705.612493, '_id': ObjectId('55d6e5114d02f49f998a08b5')}"
    

    【讨论】:

      猜你喜欢
      • 2015-04-08
      • 1970-01-01
      • 1970-01-01
      • 2019-07-24
      • 1970-01-01
      • 1970-01-01
      • 2013-10-29
      • 1970-01-01
      • 2018-04-08
      相关资源
      最近更新 更多