【发布时间】:2021-12-31 21:37:57
【问题描述】:
我想通过将连续列保持为行并将分类因子作为列标题进行分组,聚合记录为平均值、最小值或最大值。这是一个基本问题,我无法弄清楚答案。以虹膜数据为例。我想获得每个物种类别的 sepal.width 和 sepal.length 的平均值。
library(dplyr)
mydata2 <-iris
# Groupby function for dataframe in R
summarise_at(group_by(mydata2,Species),vars(Sepal.Length),funs(mean(.,na.rm=TRUE)))
OUTPUT
Species Sepal.Length
<fct> <dbl>
1 setosa 5.01
2 versicolor 5.94
3 virginica 6.59
我想用 Sepal.Length 作为我的行而不是 Species 和 Species 的各种因素作为我的列获得相同的输出。我也想要 Sepal.Width、Petal.Length、Petal.Width 该怎么做?
这就是我要找的 -
Species setosa versicolor virginica
1 Sepal.Length 5.01 5.94 6.59
下面应该有 Sepal.Width 和其他连续的列。 我尝试过转置,但这会将所有内容都更改为字符数据类型。
【问题讨论】: