【问题标题】:Data Frame Manipulation: Operation on Variables数据框操作:变量操作
【发布时间】:2019-05-01 15:32:43
【问题描述】:

我有一个名为“Bycountry”的数据框,如下所示:

国家/地区 1 阿尔及利亚 1 2 法国 2 3 突尼斯 3 4 阿尔及利亚 4 5 阿勒马涅 5 6 法国 6

我想对此数据框进行统计:

  • 在国家列中,国家/地区的摘要(不重复)
  • 在数字列中,按国家/地区的总和

我已经安装了 plyrdplyr 软件包,所以我知道我必须使用 mutate()summarise()group_by(),但我不知道在哪个或如何使用。

   Otherbycountry <- data.frame(
          Countries = c("Algerie", "France", "Tunisie", "Algerie", 
          "Allemagne", "France"),
           Norders = c(1 , 2 , 3, 4, 5, 6))

当前结果是一个 1x1 小标题,其中包含数字的总和。

【问题讨论】:

  • 嗨@Jul,如果它是可重现的,那么在这个问题上获得帮助会更容易:stackoverflow.com/q/5963269/3277821
  • 嗨@sboysel 我刚刚编辑了我的问题,你能帮我解决这个问题吗?

标签: r plyr dplyr


【解决方案1】:

代码

library(dplyr)
Otherbycountry %>% 
    # grouping by country
    group_by(Countries) %>% 
    # sum of Norders column (for each group) 
    summarise(Norders_sum = sum(Norders)) %>% 
    # ungroup
    ungroup()
  • 在 R 中键入 ?group_by?summarise?group_by 以了解有关函数的更多信息。
  • 阅读有关 grouped summaries 的部分(Garrett Grolemund 和 Hadley Wickham 的 R for Data Science)了解更多详情。

输出

# # A tibble: 4 x 2
# Countries Norders_sum
# <fct>           <dbl>
# 1 Algerie             5
# 2 Allemagne           5
# 3 France              8
# 4 Tunisie             3

【讨论】:

    猜你喜欢
    • 2017-11-30
    • 2013-03-04
    • 2021-06-28
    • 2021-06-28
    • 2015-09-19
    • 2020-12-07
    相关资源
    最近更新 更多