【问题标题】:Return nested list with nested level and value返回具有嵌套级别和值的嵌套列表
【发布时间】:2016-12-15 05:54:41
【问题描述】:

我想使用 networkD3 可视化一些深度嵌套的数据。在发送到radialNetwork 之前,我不知道如何将数据转换为正确的格式。

这是一些示例数据:

level <- c(1, 2, 3, 4, 4, 3, 4, 4, 1, 2, 3)
value <- letters[1:11]

其中level 表示嵌套的级别,value 是节点的名称。通过使用这两个向量,我需要将数据转换为以下格式:

my_list <- list(
  name = "root",
  children = list(
    list(
      name = value[1], ## a
      children = list(list(
        name = value[2], ## b
        children = list(list(
          name = value[3], ## c
          children = list(
            list(name = value[4]), ## d
            list(name = value[5]) ## e
          )
        ),
        list(
          name = value[6], ## f
          children = list(
            list(name = value[7]), ## g
            list(name = value[8]) ## h
          )
        ))
      ))
    ),
    list(
      name = value[9], ## i
      children = list(list(
        name = value[10], ## j
        children = list(list(
          name = value[11] ## k
        ))
      ))
    )
  )
)

这是解析后的对象:

> dput(my_list)
# structure(list(name = "root",
#                children = list(
#                  structure(list(
#                    name = "a",
#                    children = list(structure(
#                      list(name = "b",
#                           children = list(
#                             structure(list(
#                               name = "c", children = list(
#                                 structure(list(name = "d"), .Names = "name"),
#                                 structure(list(name = "e"), .Names = "name")
#                               )
#                             ), .Names = c("name",
#                                           "children")), structure(list(
#                                             name = "f", children = list(
#                                               structure(list(name = "g"), .Names = "name"),
#                                               structure(list(name = "h"), .Names = "name")
#                                             )
#                                           ), .Names = c("name",
#                                                         "children"))
#                           )), .Names = c("name", "children")
#                    ))
#                  ), .Names = c("name",
#                                "children")), structure(list(
#                                  name = "i", children = list(structure(
#                                    list(name = "j", children = list(structure(
#                                      list(name = "k"), .Names = "name"
#                                    ))), .Names = c("name",
#                                                    "children")
#                                  ))
#                                ), .Names = c("name", "children"))
#                )),
#           .Names = c("name",
#                      "children"))

然后我可以将它传递给最终的绘图函数:

library(networkD3)
radialNetwork(List = my_list)

输出将如下所示:


问题:如何创建嵌套列表?

注意:正如@zx8754 所指出的,这个SO post 中已经有一个解决方案,但这需要data.frame 作为输入。由于我的level 不一致,我看不到将其转换为data.frame 的简单方法。

【问题讨论】:

  • @zx8754 添加了dput(my_list)。另外,输入的数据不是data.frame,把它变成data.frame也不容易IMO,因为级别不一致。这就是为什么我标记recursion 并认为这可能是方向。但是,如果我错了,请纠正我。
  • 我们需要一个递归函数来获取数据帧并根据最小值进行拆分,抱歉目前没有时间编写代码。类似于:df1 &lt;- data.frame(level, value, stringsAsFactors = FALSE); split(df1, cumsum(df1$level == 1)) 然后删除最小值,然后拆分下一个最小值,等等。
  • 我也在考虑这个问题,但不确定如何将每个孩子标记为正确的父母。换句话说,我们如何防止将第 2 级 2 值标记为第 1 个父级。

标签: r recursion nested-lists networkd3


【解决方案1】:

使用data.table 风格的合并:

library(data.table)
dt = data.table(idx=1:length(value), level, parent=value)

dt = dt[dt[, .(i=idx, level=level-1, child=parent)], on=.(level, idx < i), mult='last']

dt[is.na(parent), parent:= 'root'][, c('idx','level'):= NULL]

> dt
#     parent child
#  1:   root     a
#  2:      a     b
#  3:      b     c
#  4:      c     d
#  5:      c     e
#  6:      b     f
#  7:      f     g
#  8:      f     h
#  9:   root     i
# 10:      i     j
# 11:      j     k

现在我们可以使用其他post的解决方案了:

x = maketreelist(as.data.frame(dt))

> identical(x, my_list)
# [1] TRUE

【讨论】:

【解决方案2】:

作为前言,您的数据很难处理,因为关键信息是按照level 中的值的顺序编码的。我不知道您是如何按此顺序获得这些值的,但请考虑一下,首先可能有更好的方法来构造这些信息,这将使下一个任务更容易。

这是一种base-y 方法,可将您的数据转换为具有 2 列的数据框,parentchild,然后将其传递给可轻松转换为所需 JSON 格式的 data.tree 函数。 ..然后将其传递给radialNetwork...

level <- c(1, 2, 3, 4, 4, 3, 4, 4, 1, 2, 3)
value <- letters[1:11]

library(data.tree)
library(networkD3)

parent_idx <- sapply(1:length(level), function(n) rev(which(level[1:n] < level[n]))[1])
df <- data.frame(parent = value[parent_idx], child = value, stringsAsFactors = F)
df$parent[is.na(df$parent)] <- ""

list <- ToListExplicit(FromDataFrameNetwork(df), unname = T)
radialNetwork(list)

这是实现相同目标的tidyverse 方式...

level <- c(1, 2, 3, 4, 4, 3, 4, 4, 1, 2, 3)
value <- letters[1:11]

library(tidyverse)
library(data.tree)
library(networkD3)

data.frame(level, value, stringsAsFactors = F) %>%
  mutate(row = row_number()) %>%
  mutate(level2 = level, value2 = value) %>%
  spread(level2, value2) %>%
  mutate(`0` = "") %>%
  arrange(row) %>%
  fill(-level, -value, -row) %>%
  gather(parent_level, parent, -level, -value, -row) %>%
  filter(parent_level == level - 1) %>%
  arrange(row) %>%
  select(parent, child = value) %>%
  data.tree::FromDataFrameNetwork() %>%
  data.tree::ToListExplicit(unname = TRUE) %>%
  radialNetwork()

另外,networkD3 (v0.4.9000) 的当前开发版本有一个新的 treeNetwork 函数,该函数采用带有 nodeIdparentId 列/变量的数据框,这消除了对data.tree 函数转换为 JSON,所以这样的工作......

level <- c(1, 2, 3, 4, 4, 3, 4, 4, 1, 2, 3)
value <- letters[1:11]

library(tidyverse)
library(networkD3)

data.frame(level, value, stringsAsFactors = F) %>%
  mutate(row = row_number()) %>%
  mutate(level2 = level, value2 = value) %>%
  spread(level2, value2) %>%
  mutate(`0` = "root") %>%
  arrange(row) %>%
  fill(-level, -value, -row) %>%
  gather(parent_level, parent, -level, -value, -row) %>%
  filter(parent_level == level - 1) %>%
  arrange(row) %>%
  select(nodeId = value, parentId = parent) %>%
  rbind(data.frame(nodeId = "root", parentId = NA)) %>% 
  mutate(name = nodeId) %>% 
  treeNetwork(direction = "radial")

【讨论】:

    猜你喜欢
    • 2016-06-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-02-21
    • 1970-01-01
    • 2019-03-22
    • 2019-08-13
    相关资源
    最近更新 更多