【发布时间】:2021-12-04 17:47:55
【问题描述】:
我正在尝试转换在某个日期具有多个产品销售的数据集。最后,我只想保留包含每天产品销售额总和的唯一列。
我的 MRE:
df <- data.frame(created = as.Date(c("2020-01-01", "2020-01-01", "2020-01-02", "2020-01-02", "2020-01-03", "2020-01-03"), "%Y-%m-%d", tz = "GMT"),
soldUnits = c(1, 1, 1, 1, 1, 1),
Weekday = c("Mo","Mo","Tu","Tu","Th","Th"),
Sunshinehours = c(7.8,7.8,6.0,6.0,8.0,8.0))
看起来像这样:
Date soldUnits Weekday Sunshinehours
2020-01-01 1 Mo 7.8
2020-01-01 1 Mo 7.8
2020-01-02 1 Tu 6.0
2020-01-02 1 Tu 6.0
2020-01-03 1 We 8.0
2020-01-03 1 We 8.0
变换后应该是这样的:
Date soldUnits Weekday Sunshinehours
2020-01-01 2 Mo 7.8
2020-01-02 2 Tu 6.0
2020-01-03 2 We 8.0
我尝试了aggregate() 和group_by,但没有成功,因为我的数据被删除了。
有没有人知道如何根据我提到的规范转换和清理我的数据集?
【问题讨论】:
标签: r dplyr data-analysis