【问题标题】:How do you assign groups to larger groups dpylr你如何将组分配给更大的组 dplyr
【发布时间】:2019-12-12 14:26:28
【问题描述】:

我想将组分配给更大的组,以便将它们分配给核心进行处理。我有 16 个核心。这就是我目前所拥有的

test<-data_extract%>%group_by(group_id)%>%sample_n(16,replace = TRUE)

这会从每组中取出 16 个订书钉。

这是我希望最终产品看起来像的示例(有两个集群),我真正想要的是相同的组 id 与一组集群属于同一个集群

________________________________
balance   | group_id |  cluster|
454452    | a        |  1      |
5450441   | a        |  1      |
5444531   | b        |  1      |
5404051   | b        |  1      |
5404501   | b        |  1      |
5404041   | b        |  1      |
544251    | b        |  1      |
254252    | b        |  1      |
541254    | c        |  2      |
54123254  | d        |  1      |
542541    | d        |  1      |
5442341   | e        |  2      |
541       | f        |  1      |
________________________________

【问题讨论】:

  • 这是您的预期输出还是输入?
  • 这是我的预期输出
  • ok,不好意思,没有输入样例,很难测试
  • 最好是提供输入、实际输出和预期输出。
  • 输入将是没有“集群”列的数据(抱歉造成混淆)

标签: r dplyr data-munging


【解决方案1】:

测试%group_by(group_id)%>% mutate(group = sample(1:16,1))

【讨论】:

  • 这个问题和stackoverflow.com/questions/59310398/…有什么不同
  • 显然不是,我认为用组来描述问题最终会令人困惑,而实际上这并不重要,因为 group_by 最终将组视为同一行
猜你喜欢
  • 2016-12-27
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-11-17
  • 2021-03-08
  • 2020-01-04
  • 2014-11-23
  • 1970-01-01
相关资源
最近更新 更多