【问题标题】:Extracting data from nested json arrays in python从python中的嵌套json数组中提取数据
【发布时间】:2019-03-08 02:49:06
【问题描述】:

我无法从 python 中的嵌套 json 中提取数据。我想创建一个包含“bill”所有值的单列熊猫数据框,例如

bill
----
a1
a2
a3

使用格式如下的 API 输出:

{
  "status": "succeeded",
  "travels": [
    {
      "jobs": [
        {
          "bill": "a1"
        },
        {
          "bill": "a2"
        },
        {
          "bill": "a3"
        }
      ],
      "vehicle": {
        "plate": "xyz123"
      }
    }
  ]
}

将 json 直接加载到 pandas 中只会给我“bill”的第一个实例。我在“工作”上尝试过 json_normalize(),但它有一个关键错误。谁能帮我弄清楚如何只拿到“账单”?

谢谢

【问题讨论】:

    标签: python json pandas


    【解决方案1】:

    我认为您与json_normalize 走在了正确的轨道上。将您的输入作为 python 字典d:

    from pandas.io.json import json_normalize
    json_normalize(d, record_path=['travels', 'jobs'])
      bill
    0   a1
    1   a2
    2   a3
    

    【讨论】:

    • 谢谢!那成功了。我不知道您不必在 json_normalize 中指定“数据”
    • 很高兴为您提供帮助!是的,json_normalize 有时会很挑剔。
    猜你喜欢
    • 2020-06-28
    • 1970-01-01
    • 2021-06-10
    • 2019-09-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多