【发布时间】:2018-12-17 15:47:06
【问题描述】:
我的数据是dataframe(fpo):
damIDpoG4 damSirepoG4 damGpoG4 damPhenpoG4 damTBVpoG4 damGBVpoG4
[1,] 450622 430878 4 5.540501 4.260957 3.422568
[2,] 450623 430878 4 3.046358 4.169094 3.528200
[3,] 450625 430878 4 4.515801 4.543196 3.843761
....
[50,] 450626 470878 4 4.798896 4.501067 3.875034
[51,] 450630 470878 4 4.282659 4.388037 3.830042
[52,] 450632 470878 4 3.553223 4.086484 3.571130
我想根据 MAX 和或 20% damGBVpoG4 从 damIDpoG4 中为每个类似的 damSirepoG4 组选择 n 个数字(例如 12) >。 damSirepoG4 包含 250 组相同的数字 我试试:
fpo %>% group_by(fpo[,2]) %>% sample_n(12)
但我的回答不正确。我无法考虑 dplyr 的最大值或百分比
感谢关注
【问题讨论】: