【发布时间】:2018-12-15 00:56:33
【问题描述】:
我正在使用 R tidyverse 包来提取大型数据集的几个子集,每个子集都匹配特定的字段名称。然而,由于要提取的子集数量很大,并且用特定的表达式逐个提取是耗时的,并且想知道是否有更快的方法来做到这一点。
这是一个最小的例子: 数据框看起来像这样,被称为“dummy”:
A <- c(605, 605, 608, 608)
B <- c(5, 6, 3, 4)
C <- c(500, 600, 300, 400)
dummy <-as.data.frame(A, B, C)
目前我所做的是:
subject1 <- filter(dummy, A == "605")
subject2 <- filter(dummy, A == "608")
由于我的原始数据集中有 100 个受试者,这个过程很耗时,想知道是否有更快的方法来做到这一点。 我注意到 A 列中的数字是按顺序排列的,但不是连续的,如示例所示。
感谢您的帮助
【问题讨论】: