【问题标题】:Count and summarise ID and the Date of Purchase while creating a third column that reflects the amount of Purchased per one day and Customer计算并汇总 ID 和购买日期,同时创建反映每天购买量和客户的第三列
【发布时间】:2019-04-06 12:23:14
【问题描述】:

亲爱的社区,下午好,

我是 R 语言的新手,如果我对问题的描述还不够精确或具体,请原谅我。

我有一个包含两列的数据框。第一个是 ID,第二个是购买日期。但是,某些 ID 在某个日期出现的频率更高,我想总结一下 ID 和日期,而第三列(购买数量)反映了购买数量。 ID and Purchase Date

非常感谢。

【问题讨论】:

  • 欢迎来到 StackOverflow!请阅读有关how to ask a good question 的信息以及如何提供reproducible example。这将使其他人更容易帮助您。
  • 您能否提供一些输入样本和预期结果,以便其他人可以更有效地帮助您?

标签: r


【解决方案1】:

有一个名为 dplyr 的 R 包使这种聚合非常容易。在您的情况下,您可以使用几行代码来汇总数据。

library(dplyr)
results <- df %>% 
  group_by(ID, Date) %>%
  summarise(numPurchases = n(),
            totalPurchases = sum(Quantity))

df 将是您的输入数据。您的结果将包含 ID 和 Date 列,以及一个计算每个日期每个 ID 的销售数量 (numPurchases) 的新列和一个显示每个日期每个 ID 的购买总量 (totalPurchases) 的新列。希望对您有所帮助。

【讨论】:

    猜你喜欢
    • 2016-12-09
    • 1970-01-01
    • 2018-05-01
    • 1970-01-01
    • 2021-11-02
    • 1970-01-01
    • 2023-03-24
    • 1970-01-01
    • 2020-07-09
    相关资源
    最近更新 更多