【发布时间】:2021-08-10 10:38:03
【问题描述】:
对数据框进行分组并能够通过组键将组作为数据框获取的最佳方法是什么?例如,如何按日期分组,然后获取特定日期的记录?
基本上相当于 Pandas 中的get_group function。
【问题讨论】:
-
如果您创建一个小的可重现示例以及预期的输出,这将更容易提供帮助。阅读how to give a reproducible example。
对数据框进行分组并能够通过组键将组作为数据框获取的最佳方法是什么?例如,如何按日期分组,然后获取特定日期的记录?
基本上相当于 Pandas 中的get_group function。
【问题讨论】:
将分组拆分成列表是我能想到的,例如
wut=by(iris[,-5],list(iris$Species),colMeans)
wut["setosa"]
$setosa
Sepal.Length Sepal.Width Petal.Length Petal.Width
5.006 3.428 1.462 0.246
【讨论】:
identity 而不是colMeans 更合适,但否则这正是我想要的。谢谢!
您可以使用 dplyr 包中的group_split 来返回由分组变量分隔的数据帧列表
【讨论】:
使用dplyr
library(dplyr)
iris %>%
group_by(Species) %>%
summarise(across(everything(), mean))
【讨论】: