【发布时间】:2018-05-25 08:31:18
【问题描述】:
我的问题是如何创建一个新列,该列是 dplyr 中某些特定列(按名称选择)的总和。 例如,对于 iris 数据集,我创建了一个名为 Petal 的新列,它是 Petal.Length 和 Petal.Width 的总和。
iris %>% mutate(Petal = Petal.Length+Petal.Width)
现在想象一下,我有一个包含 20 列的数据集,其名称中包含“花瓣”。我想创建一个汇总所有这些列的“花瓣”列。我绝对不想在我的代码中键入所有列名。感觉应该可以用 dplyr 中的一行代码来实现。 如果有人可以提供帮助,请不胜感激。
【问题讨论】:
-
听起来您的数据格式不整齐。最好将
gather()转换为长格式和summarize()。关于“从宽到长”的重塑存在许多现有问题。