【问题标题】:R function - summarize 2 variables at the same timeR函数-同时汇总2个变量
【发布时间】:2021-09-05 04:16:04
【问题描述】:

我有以下代码。简而言之,我的文件只是按日期、公司等分类的销售额。我想汇总和分组我的数据,但是我无法同时汇总我的总销售额和数量。我一定错过了一些简单的东西。现在代码确实总结了我的 salesdollar 字段,但我还想要创建一个新的“total_Quantity”字段来总结我的数据集中的字段“数量”。我该怎么说呢?

    Sales_2019<- read.csv ("C:/Users/anwei/Desktop/salesFINAL.csv")
    Sales_2019

    attach(Sales_2019)
    library(timeDate)
    library(dplyr)
    library(tidyr)

    SalesSum_fin<- Sales_2019 %>% 
      group_by(Store, Classification, SalesDate) %>% 
      summarize(OverallSales = 
                  sum(SalesDollars, na.rm=TRUE))

【问题讨论】:

  • SalesSum_fin% group_by(Store, Classification, SalesDate) %>% summarise(OverallSales = sum(SalesDollars, na.rm = TRUE), TotalQuantity = sum(Quantity, na.rm = TRUE))- 试试看!它会工作
  • 你也可以使用across,见here
  • 你能添加一个示例输入数据框吗?
  • 我准备好了!谢谢Luiy_coder!这有帮助。

标签: r dplyr summarize


【解决方案1】:

看看这个!您只需要使用 dplyr 中的汇总。 为清楚起见,这是我考虑过的数据。

我刚刚排除了日期列。您可以在脚本中添加它。

Store = c("A", "A", "A", "B", "B")
Classification = c("ABC", "ABC", "ABC", "ABC", "ABC")
SalesDollars = c(1234, 345, 567, 789, 432)
Quantity = c(1, 2, 3, 4, 5)

Sales_2019 = data.frame(Store, Classification, SalesDollars, Quantity, stringsAsFactors = FALSE)

SalesSum_fin<- Sales_2019 %>% 
  group_by(Store, Classification) %>% 
  summarise(OverallSales = sum(SalesDollars, na.rm=TRUE),
            Quantity     = sum(Quantity, na.rm = TRUE))

这是输出:-

【讨论】:

    猜你喜欢
    • 2017-04-27
    • 1970-01-01
    • 1970-01-01
    • 2018-11-03
    • 2018-10-31
    • 2023-04-03
    • 1970-01-01
    • 2015-04-27
    • 2017-01-11
    相关资源
    最近更新 更多