【发布时间】:2020-08-22 18:26:29
【问题描述】:
我有一个包含 id、类别、时间戳、价格列的 spark 数据框。我想按客户 ID 对数据进行分组,按时间戳对类别进行排序,并获取每个组中的最后 n 行。
我尝试了下面的代码,但它只为整体数据重新调整了 3 行。 a <- data1 %>% dplyr::group_by(customer_id, category) %>% dplyr::arrange(dplyr::desc(timestamp)) %>% head(., n = 3)
请提出一个有效的解决方案
【问题讨论】:
标签: r dplyr tidyverse sparklyr