【问题标题】:How to flatten nested data frames returned from jsonlite如何展平从 jsonlite 返回的嵌套数据帧
【发布时间】:2014-10-21 23:39:25
【问题描述】:

我正在用 jsonlite 加载这个 JSON 数据

<snip>  
"rawData": {
    "fortune": {}, 
    "plaintext": {}, 
    "db": {}, 
    "update": {
      "duda": [
        {
          "latencyAvg": "201.40us", 
          "latencyMax": "727.00us", 
          "latencyStdev": "54.85us", 
          "totalRequests": 561810, 
          "startTime": 1413890149, 
          "endTime": 1413890164
        }
      ]
      }, 
    "json": {
      "duda": [
        {
          "latencyAvg": "201.40us", 
          "latencyMax": "727.00us", 
          "latencyStdev": "54.85us", 
          "totalRequests": 561810, 
          "startTime": 1413890149, 
          "endTime": 1413890164
        }
      ]
    }, 
    "query": {}
  }

这会导致具有嵌套数据框的结构

data <- structure(list(fortune = structure(list(), .Names = character(0)), 
    plaintext = structure(list(), .Names = character(0)), db = structure(list(), .Names = character(0)), 
    update = structure(list(duda = structure(list(latencyAvg = "201.40us", 
        latencyMax = "727.00us", latencyStdev = "54.85us", totalRequests = 561810L, 
        startTime = 1413890149L, endTime = 1413890164L), .Names = c("latencyAvg", 
    "latencyMax", "latencyStdev", "totalRequests", "startTime", 
    "endTime"), class = "data.frame", row.names = 1L)), .Names = "duda"), 
    json = structure(list(duda = structure(list(latencyAvg = "201.40us", 
        latencyMax = "727.00us", latencyStdev = "54.85us", totalRequests = 561810L, 
        startTime = 1413890149L, endTime = 1413890164L), .Names = c("latencyAvg", 
    "latencyMax", "latencyStdev", "totalRequests", "startTime", 
    "endTime"), class = "data.frame", row.names = 1L)), .Names = "duda"), 
    query = structure(list(), .Names = character(0))), .Names = c("fortune", 
"plaintext", "db", "update", "json", "query"))

我想创建一个如下所示的单个 data.frame:

Type   | Name | latencyAvg | latencyMax | latencyStdev | totalRequests | startTime | endTime
json   | duda | 201.40us   | <etc..>
update | duda | 201.40us   | <etc..>

通过扁平化嵌套的数据框。我正在弄清楚如何通过删除我想要的项目并使用 rbind/cbind 将它们移动到新的数据框来手动执行此操作,但是有没有一种简单的方法来执行这种类型的递归展平?

【问题讨论】:

  • 您需要提供可能的安排和将要进入的名称。是否总是有两个命名项目'json'和'update'?
  • JSON 示例完全涵盖了我希望看到的数据 - 第一个嵌套框架将具有名称 json、update、query 等。第二个嵌套帧将具有latencyAvg、latencyStdev等。预计不会对来自 JSON 的数据进行其他安排
  • 你是如何用jsonlite 加载这个的?写入文件后我一直在尝试加载它几次,但我无法正确加载它
  • 我认为这里有一个整齐的差距 - 即不需要手动识别嵌套元素的解决方案,例如 tidyr::unnest 用于嵌套列表列。

标签: r nested dataframe jsonlite


【解决方案1】:

假设该对象被命名为“数据”的不幸名称:

newdat <- rbind.data.frame( Type= c(rep("json",   nrow(data$json$duda)), 
                                    rep("update", nrow(data$update$duda)) ), 
                            rbind( data$json$duda, data$update$duda) )

【讨论】:

    【解决方案2】:

    使用flatten 函数。它获取一个数据框并返回一个平面数据框。 如果您需要从源数据框中排除某些列,请使用df[[-i]] 排除列i

    【讨论】:

    • 没有这个功能。 &gt; flatten() Error in flatten() : could not find function "flatten"
    • 可能你没有看标题,检查jsonlite::flatten()。这个函数存在于jsonlite包中。
    【解决方案3】:

    另一条线

    do.call(rbind, lapply(data[c('json', 'update')], '[[', 'duda'))
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2012-05-02
      • 1970-01-01
      • 2023-03-03
      • 2019-12-18
      • 2021-10-12
      • 1970-01-01
      • 2014-08-29
      • 2021-04-20
      相关资源
      最近更新 更多