【发布时间】:2016-03-27 04:19:33
【问题描述】:
作为我的数据示例,我在数据框中有 GROUP 1 和三行数据,GROUP 2 有两行数据:
GROUP VARIABLE 1 VARIABLE 2 VARIABLE 3
1 2 6 5
1 4 NA 1
1 NA 3 8
2 1 NA 2
2 9 NA NA
我想从 GROUP 1 中的每列对单个变量进行采样,以创建代表 GROUP 1 的新行。我不想从 GROUP 1 中采样一个完整的行,而是需要单独进行采样对于每一列。我想对 GROUP 2 做同样的事情。此外,采样不应考虑/包括 NA,除非该组变量的所有行都有 NA(例如上面的 GROUP 2、VARIABLE 2)。
例如,采样后,我可能会得到这样的结果:
GROUP VARIABLE 1 VARIABLE 2 VARIABLE 3
1 4 6 1
2 9 NA 2
只有第 2 组变量 2 可以在此处生成 NA。我实际上有 39 个组、50,000 多个变量和大量 NA。我真诚地感谢代码制作一个新的行数据框,每行都有每组的采样结果。
【问题讨论】:
标签: r dataframe subset sample missing-data