【发布时间】:2015-07-06 02:18:53
【问题描述】:
我有一个数据框,其中包含患者“ID”、“TIME”、“DV”、“AMT”、“EVID:事件 ID”、“MDV:缺少 DV”和几个患者协变量,如下所示。
df
ID TIME DV AMT MDV EVID WT SEX
9010 0 NA 50 1 1 70 0
9010 0.5 0.2 0 0 0 70 0
9010 1 5 0 0 0 70 0
9010 5 10 0 0 0 70 0
9011 0 NA 50 1 1 60 1
9011 1 4 0 0 0 60 1
9011 3 6 0 0 0 60 1
9011 6 10 0 0 0 60 1
除了“df”中包含的时间之外,我还需要为每个主题 ID 添加一个唯一“TIME”序列。
timeseq <- c(seq(0.05,5,by=0.1))
对于添加时间的行,“DV=NA;AMT=0;MDV=0;EVID=0”。 “ID ; WT; SEX”应该保持不变。
我需要有关如何使用 R 将这些额外时间点添加到我的数据框的帮助。我有庞大的数据集,并且不同主题的采样时间点不同。
【问题讨论】:
-
这几乎可以肯定是重复的,您只需要合并
ID和TIME的所有可能组合 - 例如:merge(df,expand.grid(ID=unique(df$ID),TIME=timeseq),by=c("ID","TIME"),all=TRUE) -
@thelatemail 谢谢。但是,这会为其他列提供
NA! -
根据您的要求查看我的答案。