你如何将组分配给更大的组 dplyr答案

【问题标题】：How do you assign groups to larger groups dpylr你如何将组分配给更大的组 dplyr
【发布时间】：2019-12-12 14:26:28
【问题描述】：

我想将组分配给更大的组，以便将它们分配给核心进行处理。我有 16 个核心。这就是我目前所拥有的

test<-data_extract%>%group_by(group_id)%>%sample_n(16,replace = TRUE)

这会从每组中取出 16 个订书钉。

这是我希望最终产品看起来像的示例（有两个集群），我真正想要的是相同的组 id 与一组集群属于同一个集群

________________________________
balance   | group_id |  cluster|
454452    | a        |  1      |
5450441   | a        |  1      |
5444531   | b        |  1      |
5404051   | b        |  1      |
5404501   | b        |  1      |
5404041   | b        |  1      |
544251    | b        |  1      |
254252    | b        |  1      |
541254    | c        |  2      |
54123254  | d        |  1      |
542541    | d        |  1      |
5442341   | e        |  2      |
541       | f        |  1      |
________________________________

【问题讨论】：

这是您的预期输出还是输入？
这是我的预期输出
ok，不好意思，没有输入样例，很难测试
最好是提供输入、实际输出和预期输出。
输入将是没有“集群”列的数据（抱歉造成混淆）

标签： r dplyr data-munging

【解决方案1】：

测试%group_by(group_id)%>% mutate(group = sample(1:16,1))

【讨论】：

这个问题和stackoverflow.com/questions/59310398/…有什么不同
显然不是，我认为用组来描述问题最终会令人困惑，而实际上这并不重要，因为 group_by 最终将组视为同一行