【问题标题】:subsetting elements of a list by elements of another list另一个列表的元素对列表的元素进行子集化
【发布时间】:2019-02-21 02:50:27
【问题描述】:

假设我有一个包含四个数据帧的列表,其中包含一些 NA 值:

my.list<-replicate(4,data.frame())
names(my.list)<-paste0("Frame.Number", c(1:4))
for (i in 1:4){
  my.list[[i]]<-mapply(rnorm,10,c(1:4))
  my.list[[i]][i+1,3]<-NA
  my.list[[i]][c(i,i*2),4]<-NA
}

对于每个 data.frames,我想在第 4 列中选择那些不包含 NA 的行。例如,我可以创建一个向量列表 (?),其中包含有关每个 data.frame 中案例完整性的信息:

selector <- lapply(my.list,"[",, 4)
selector <- lapply(selector,complete.cases)

现在这是我卡住的地方:如何将selector 列表应用于my.list 列表以便仅选择完整的案例?我以为我可以再次使用lapply,但我想不出一些有意义的语法。

【问题讨论】:

  • lapply(my.list, function(x) x[complete.cases(x),])
  • 感谢您的快速回复。 “现实”有点复杂:因此我将更新我的问题。
  • 是的。这就是我一直在寻找的。看起来很简单,但是当你对 R 不太熟悉时,找到这样的东西可能会很痛苦。谢谢!

标签: r list subset


【解决方案1】:

我们可以lapply 遍历列表,选择第 4 列并获取非 NA 值的索引并相应地对矩阵进行子集化。

lapply(my.list,function(x) x[!is.na(x[,4]), ])

#$Frame.Number1
#           [,1]       [,2]     [,3]     [,4]
#[1,]  0.3668229  2.0688573 2.466580 4.339755
#[2,] -0.6391422  3.2635271 2.011809 3.296089
#[3,]  0.8662670  2.2797301 4.838563 4.443876
#[4,] -0.8972108  2.9305257 3.461650 5.525453
#[5,] -0.3452349 -0.2211153 2.570717 3.915671
#[6,]  0.6464616  2.3472838 4.009406 3.436188
#[7,]  0.9341354  2.3092428 2.338770 4.359324
#[8,] -0.5652311  3.2143472 1.944220 4.042566

#$Frame.Number2
#            [,1]      [,2]     [,3]     [,4]
#[1,]  0.22304364 2.6085569 3.459335 2.575920
#[2,] -0.08987518 2.9515099       NA 3.775579
#[3,]  2.03265254 0.9405609 3.266783 4.009509
....

【讨论】:

    猜你喜欢
    • 2014-02-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-08-24
    • 2019-08-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多