【发布时间】:2018-08-03 07:18:10
【问题描述】:
嗯,我知道已经有很多相关的问题,但没有一个能回答我的特殊需求。
我想在一个有 50 列的表上使用 dplyr "summarize",我需要对这些应用不同的汇总函数。
“Summarize_all”和“summarize_at”似乎都有一个缺点,即无法将不同的函数应用于不同的变量子组。
例如,假设 iris 数据集有 50 列,因此我们不想按名称来寻址列。我想要前两列的总和,第三列的平均值和所有剩余列的第一个值(在 group_by(Species) 之后)。我怎么能这样做?
【问题讨论】:
-
不确定我是否正确,但直接引用 here 之类的列号或提取列名并使用这些可能吗?
-
欢迎来到 Stack Overflow,为了在这里寻求帮助,请考虑how to write a reproducible example,谢谢。
-
用iris例子给出了可重现的例子。
-
人们只是逐字重复指南是怎么回事。这个问题很清楚。