【发布时间】:2019-05-02 23:05:51
【问题描述】:
我有在可变数量的时间点对每个受试者 (id) 进行重复测量的数据。我想为每个主题保留两行,时间点 == 0 和最接近 4 的时间点。如果有两个候选时间点与 4 等距的行,例如(3, 5),我要选最低的 (3)。
如下图的“选择”列所示,带有“x”的行将不会被保留。
dat <- structure(list(id = c(172507L, 172507L, 172507L, 172525L, 172525L,
172525L, 172526L, 172526L, 172526L, 172527L, 172527L, 172527L,
172527L, 172527L), timepoint = c(0L, 2L, 6L, 0L, 4L, 5L, 0L,
5L, 2L, 2L, 3L, 5L, 6L, 0L)), class = "data.frame", row.names = c(NA,
-14L))
【问题讨论】:
-
为
id = 172528的单个实例保留timepoint = 3,但为172529的单个实例丢弃timepoint = 5或@987654329的单个实例丢弃timepoint = 6的逻辑是什么@ ? -
我也很困惑。为什么要丢弃
id = 172529和id = 172530的单个测量值? -
我相信现在的数据与图像的前两列相符。
标签: r dplyr data.table