【问题标题】:combining output of simulations with nested list in R将模拟输出与 R 中的嵌套列表相结合
【发布时间】:2020-08-30 22:54:39
【问题描述】:

我在 R 中使用 purrr 来模拟数据(使用 B 迭代)并运行模型以评估三种方法的性能。我想将结果收集到三个小标题的列表中(每个小标题都有B 行),在这些小标题上执行方法分析。我如何在 R (purrr) 中使用函数式编程原则来实现这一点。这是一个例子:

使用这个函数来创建一个长度 = r 的列表,其中每个 r 元素由 n 组成,从标准法线中抽取:

list_norms <- function(n, r, seed) {
  set.seed(seed)
  map(1:r, rnorm, n = n) %>%
    set_names(c("A", "B", "C"))
}

然后我用map模拟10次:

map(1:10, list_norms, n = 5, r = 3)

这里的结果是一个长度为 10 的列表,其中每个元素是一个长度为 3 的列表(分别命名为 A、B 和 C),其中每个元素都是从正态分布中抽取的 5 个向量。我想最终得到一个长度为 3 的列表,A、B 和 C 各一个,每个包含一个 10 行(模拟的每次迭代一个)和 5 列(每个从正常绘制一个)。

有没有办法通过 R 中的函数式编程原则,使用 purrr 或 tidyverse 中的其他库来实现这一点?我正在研究 map 和 reduce 的某种组合。

【问题讨论】:

    标签: r tidyverse simulation purrr


    【解决方案1】:

    我们可以transpose list 然后从每个list 元素创建一个data.frame

    library(dplyr)
    library(purrr)
    map(1:10, list_norms, n = 5, r = 3) %>% 
          transpose %>%
          map(~ as.data.frame.list(.x) %>% 
                t %>%
                  `row.names<-`(., NULL))
    #$A
    #            [,1]       [,2]       [,3]       [,4]       [,5]
    # [1,] 0.37354619  1.1836433  0.1643714  2.5952808 1.32950777
    # [2,] 0.10308545  1.1848492  2.5878453 -0.1303757 0.91974824
    # [3,] 0.03806658  0.7074743  1.2587882 -0.1521319 1.19578283
    # [4,] 1.21675486  0.4575074  1.8911446  1.5959806 2.63561800
    # [5,] 0.15914452  2.3843593 -0.2554919  1.0701428 2.71144087
    # [6,] 1.26960598  0.3700146  1.8686598  2.7271955 1.02418764
    # [7,] 3.28724716 -0.1967717  0.3057075  0.5877070 0.02932666
    # [8,] 0.91541393  1.8404001  0.5365172  0.4491650 1.73604043
    # [9,] 0.23320396  0.1835417  0.8584648  0.7223950 1.43630690
    #[10,] 1.01874617  0.8157475 -0.3713305  0.4008323 1.29454513
    
    #$B
    #           [,1]      [,2]      [,3]       [,4]      [,5]
    # [1,] 1.1795316 2.4874291 2.7383247  2.5757814 1.6946116
    # [2,] 2.1324203 2.7079547 1.7603020  3.9844739 1.8612130
    # [3,] 2.0301239 2.0854177 3.1166102  0.7811426 3.2673687
    # [4,] 2.6892754 0.7187534 1.7868555  3.8965399 3.7768632
    # [5,] 1.3970920 1.5278336 1.3646287  1.7142264 2.1381082
    # [6,] 2.3680252 0.6907957 2.7386219  2.0448730 0.9516028
    # [7,] 1.0527201 2.7481393 1.8830448  2.1526576 4.1899781
    # [8,] 1.8921186 1.8297109 0.9116683 -1.0110517 1.4068257
    # [9,] 0.8131275 3.1919869 1.9818097  1.7519154 1.6370631
    #[10,] 2.3897943 0.7919238 1.6363240  0.3733273 1.7435216
    #...
    

    如果我们也对函数稍作改动以返回tibble,我们也可以有一个单独的小标题来存储输出

    list_norms <- function(n, r, seed) {
      set.seed(seed)
       map(1:r, rnorm, n = n) %>%
      set_names(c("A", "B", "C")) %>%
      as_tibble
       }
    
    map_dfr(1:10, list_norms, n = 5, r = 3, .id = 'grp')
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-01-11
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多