【发布时间】:2018-06-02 17:59:51
【问题描述】:
我从宽格式的数据框中随机抽取了 100 行(包含 20 行)。我使用了这个 r 代码:
random_100 <- df.wide[sample(nrow(df.wide), 100, replace = T),]
它返回一个包含 100 行的数据框(每行都有患者 ID、治疗结果、治疗联盟),其中患者 ID 可能会重复。这很棒,因为这就是我想要的。
由于我对纵向效应感兴趣,我现在需要从我的长格式数据框中提取相应的行(基于患者 ID)。 我尝试了以下代码:
random_long <- subset(df.long, (df.long$id %in% random_100$id))
但是,我没有接受 100 名患者(*治疗长度),而只有 20 名患者。
我需要使用什么代码来允许从长格式数据帧中抽取患者的频率与从我的宽格式数据帧中随机选择的次数一样多?
我希望我的问题足够清楚。
【问题讨论】:
-
因为同一个id有重复?
-
是的,相同的 id 有重复。
-
这就解释了为什么你只有 20 个 id。
-
您可能必须加入/合并才能获得 id 的相应信息,即使它是重复的。
-
是的,但是我怎样才能多次绘制 ids(就像在随机抽样中选择的那样频繁)?
标签: r dataframe subset longitudinal