【发布时间】:2019-12-12 14:26:28
【问题描述】:
我想将组分配给更大的组,以便将它们分配给核心进行处理。我有 16 个核心。这就是我目前所拥有的
test<-data_extract%>%group_by(group_id)%>%sample_n(16,replace = TRUE)
这会从每组中取出 16 个订书钉。
这是我希望最终产品看起来像的示例(有两个集群),我真正想要的是相同的组 id 与一组集群属于同一个集群
________________________________
balance | group_id | cluster|
454452 | a | 1 |
5450441 | a | 1 |
5444531 | b | 1 |
5404051 | b | 1 |
5404501 | b | 1 |
5404041 | b | 1 |
544251 | b | 1 |
254252 | b | 1 |
541254 | c | 2 |
54123254 | d | 1 |
542541 | d | 1 |
5442341 | e | 2 |
541 | f | 1 |
________________________________
【问题讨论】:
-
这是您的预期输出还是输入?
-
这是我的预期输出
-
ok,不好意思,没有输入样例,很难测试
-
最好是提供输入、实际输出和预期输出。
-
输入将是没有“集群”列的数据(抱歉造成混淆)
标签: r dplyr data-munging