【发布时间】:2018-11-25 05:42:06
【问题描述】:
我有一张如下所示的表格:
在表格的更下方,Target.Country 中的国家/地区在 Source.Country 中重复,因此重复组合但具有不同的数字、总和和平均值。当组合相同时,是否可以将剩余的列相加并添加一个额外的列来找到平均值?
例如:
Source.Country Target.Country number sum_intensity mean_intensity
North Korea South Korea 26492 10674.9 0.402
South Korea North Korea 34912 53848.3 1.542
成为:
Source.Country Target.Country number sum_intensity mean_intensity Average
North Korea South Korea 61404 64523.2 1.944 1.05
任何帮助都会很棒!
【问题讨论】:
-
记得标记语言!这对我来说就像r。
-
谢谢!是R。
-
请添加您的数据的真实样本,人们可以将其导入 R。屏幕截图不是很有帮助。
-
library(dplyr); df %>% mutate(grp = purrr::map2_chr(Source.Country, Target.Country, ~paste(sort(c(.x, .y))))) %>% group_by(grp) %>% summarise(number = sum(number), sum_intensity = sum(sum_intensity), mean_intensity = sum(mean_intensity), average = mean(mean_intensity))?没有可读取的数据就无法测试。 -
可能在
collapse = ' '命令中使用paste
标签: r merge unique multiple-columns