【发布时间】:2017-01-07 05:55:56
【问题描述】:
我有一个 Tibble,我注意到 dplyr::rowwise() 和 sum() 的组合不起作用。我知道这个主题有很多线程,我有 2 到 3 个解决方案,但我不太明白为什么 rowwise() 和 sum() 的组合不起作用。
所以,我的问题是:为什么rowwise() 和sum() 的组合不起作用?我们可以做些什么来使它起作用?我是初学者,所以我相信我在下面的代码中做错了。
数据:
dput(data)
structure(list(Fiscal.Year = c(2016L, 2016L, 2016L, 2016L, 2016L,
2016L, 2016L, 2016L, 2016L, 2016L), col1 = c(0, 26613797.764311,
0, 12717073.587292, 0, 0, 0, 0, 0, 0), col2 = c(0, 0, 0, 0, 8969417.89721166,
0, 11483606.8417117, 0, 0, 0), col3 = c(0, 0, 33251606.347943,
0, 25082683.4492186, 0, 17337191.3014127, 0, 0, 0), col4 = c(0,
0, 0, 0, 0, 0, 0, 0, 0, 0), col5 = c(0, 0, 0, 0, 0, 0, 0, 0,
0, 9796823.229998), col6 = c(35822181.695755, 17475066.870565,
0, 0, 0, 0, 4040695.327278, 0, 13117249.623068, 0), col7 = c(0,
0, 0, 0, 0, 18347258.910001, 0, 0, 7002205.087399, 0), No.Trans = c(2987L,
1292L, 1002L, 796L, 691L, 677L, 400L, 388L, 381L, 366L)), .Names = c("Fiscal.Year",
"col1", "col2", "col3", "col4", "col5", "col6", "col7", "No.Trans"
), row.names = c(NA, -10L), class = c("tbl_df", "tbl", "data.frame"
))
此代码不起作用:
data %>% #No
dplyr::rowwise() %>%
dplyr::mutate(sum = sum(.[2:8]))
仅供参考,我尝试了以下一组代码,它们可以工作。我正在专门寻找使用rowwise() 和sum() 的解决方案。
选项 1: 讨论于:Summarise over all columns
data %>%
dplyr::rowwise() %>%
do(data.frame(., res = sum(unlist(.)[2:8])))
选项 2:
rowSums(data[,2:8])
选项 3: 讨论于:How to do rowwise summation over selected columns using column index with dplyr?
data %>% mutate(sum=Reduce("+",.[2:8]))
选项 4:
data %>%
select(2:8)%>%
dplyr::mutate(sum=rowSums(.))
【问题讨论】:
-
为什么要走这条路线,与你在帖子中提到的一些方法相比效率不高
-
@akrun - 感谢您的提问。 “通过有效”,您指的是来自基础 R 的那个吗?作为初学者,我相信我对
dplyr缺乏了解。因此,我想学习如何修复错误。这只会帮助我。 -
rowSums和Reduce这两种方法效率很高 -
关于为什么它不起作用,我不确定。您获得的值与
data[-1] %>% rowwise() %>% sum相同,即。整个值的总和,它可能是一个错误或设计特性