【发布时间】:2018-12-03 16:47:20
【问题描述】:
我有一个名为 oct 的大型医疗保健数据样本数据
Providers ID date ICD
Billy 4504 9/11 f.11
Billy 5090 9/10 r.05
Max 4430 9/01 k.11
Mindy 0812 9/30 f.11
etc.
我想要每个提供商的 ID 号随机样本。我努力了。
review <- oct %>% group_by(Providers) %>% do (sample(oct$ID, size = 5, replace= FALSE, prob = NULL))
【问题讨论】:
-
do()如果不返回数据框并且您没有命名输出,则会返回错误。除非您以我可以复制并粘贴到 R 中的格式给出数据示例,否则我不能确定这是否适合您,但试试这个:review <- oct %>% group_by(Providers) %>% do (ID_sample = sample(ID, size = 5, replace= FALSE, prob = NULL)) -
查看
dplyr的sample_n- 您可以将其用于群组 -
这能回答你的问题吗? Take randomly sample based on groups