【问题标题】:Consider grouping for a column and selecting rows based on other columns in R考虑对列进行分组并根据 R 中的其他列选择行
【发布时间】:2018-12-17 15:47:06
【问题描述】:

我的数据是dataframe(fpo):

     damIDpoG4 damSirepoG4 damGpoG4 damPhenpoG4 damTBVpoG4 damGBVpoG4
[1,]    450622      430878        4    5.540501   4.260957   3.422568
[2,]    450623      430878        4    3.046358   4.169094   3.528200
[3,]    450625      430878        4    4.515801   4.543196   3.843761
....
[50,]    450626      470878        4    4.798896   4.501067   3.875034
[51,]    450630      470878        4    4.282659   4.388037   3.830042
[52,]    450632      470878        4    3.553223   4.086484   3.571130

我想根据 MA​​X 和或 20% damGBVpoG4damIDpoG4 中为每个类似的 damSirepoG4 组选择 n 个数字(例如 12) >。 damSirepoG4 包含 250 组相同的数字 我试试:

fpo %>% group_by(fpo[,2]) %>% sample_n(12)

但我的回答不正确。我无法考虑 dplyr 的最大值或百分比
感谢关注

【问题讨论】:

    标签: r grouping


    【解决方案1】:

    我们需要在group_by 中传递列名(假设'fpo' 是data.frame/tbl_df 而不是matrix

    fpo %>% 
        group_by(damSirepoG4) %>%
        sample_n(12)
    

    【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-08-24
    • 2015-02-14
    • 2017-02-20
    • 2021-12-17
    • 2021-02-19
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多