【发布时间】:2022-01-15 06:43:36
【问题描述】:
我有以下数据框Data:
| a | b | c |
|---|---|---|
| 1 | 1 | 2 |
| 2 | NA | 4 |
| NA | 3 | NA |
| NA | NA | NA |
我想使用dplyrs mutate 函数和sum 计算列 a 到 c 的总和以获得以下结果:
| a | b | c | d |
|---|---|---|---|
| 1 | 1 | 2 | 5 |
| 2 | NA | 4 | 6 |
| NA | 3 | NA | 3 |
| NA | NA | NA | NA |
重要的是 NA 基本上被视为 0,除非它们都是 NA,然后它会将总和返回为 NA。
我想我可以做到:
Data<-Data %>%
mutate(d=sum(a,b,c,na.rm=TRUE))
问题是我不想列出所有变量ab 和c,而是想利用: 功能,以便我可以列出像这样a:c 的变量。
我想写这样的代码:
Data<-Data %>%
mutate(d=sum(a:c,na.rm=TRUE))
但这不起作用。我不知道我是否应该在 a 和 c 周围加上引号?
我发誓我之前已经完成了这一百万次,但是我找不到以前使用过的代码,并且由于某种原因我今天的大脑冻结了。
【问题讨论】: