【问题标题】:How to properly encode data in JSON from Dataframe in Pandas如何在 Pandas 中的 Dataframe 中正确编码 JSON 中的数据
【发布时间】:2021-02-25 14:22:42
【问题描述】:

我有一个带有北欧字母 æ、ø 和 å 的 Pandas 数据框。我想将此数据框格式化为 JSON。除了在 JSON 文件中 å 写成“\\u00e5”之外,一切都运行良好。我尝试了以下方法:

import json

df_qnapairs.questions = df_qnapairs.questions.str.encode('utf-8')

json_dump = json.dumps(df_qnapairs.to_json(orient = 'records'), ensure_ascii = False)

json_dump

但是,输出看起来完全一样,它不处理æ、ø、å。

有什么建议吗?这是在 Python 中的 Databricks

【问题讨论】:

标签: python json pandas dataframe encoding


【解决方案1】:

过了一会儿,我找到了解决方案,问题出在 to_json 函数上。我需要添加 force_ascii = False 参数

df_qnapairs.to_json(orient = 'records', force_ascii = False)

【讨论】:

    猜你喜欢
    • 2021-01-21
    • 1970-01-01
    • 1970-01-01
    • 2014-02-24
    • 2016-01-21
    • 2019-02-03
    • 2021-03-28
    • 2014-12-16
    • 1970-01-01
    相关资源
    最近更新 更多