回复Farrel answer:
在RSeek for rowProd 我找到了两个包 - matrixStats 和 fUtilities。你可以看看他们。
第二种解决方案有点棘手。您可以创建自己的表达式并对其进行评估。
X <- structure(list(
varA = c(0.98, 0.75, -0.56, -1.43, 0.65, -1.15, -1.52, 0.1, 0.06, 0.76),
varB = c(-0.12, -0.6, 0.62, 0.9, -0.44, 0.37, 0.62, 0.76, -1.61, -0.26),
varC = c(-0.5, -0.37, -0.43, -0.7, 0.83, -0.24, -0.57, 0.05, -1.31, 0.7),
varD = c(-0.06, -0.11, 1.03, -1.76, -0.42, -1.21, -0.62, -1, -1.16, 2.13),
varE = c(-1.96, 0.69, -1.85, -1.74, -1.47, 1.24, 0.29, -1.18, 0.89, 0.42),
varF = c(0.29, -0.22, -1.29, 1.19, 0.38, -0.23, -0.5, -1.07, -1.83, 0.58),
varG = c(0.59, -0.41, -1.37, 0.89, -0.75, 0.95, 0.95, -0.9, 0.71, -1.3)
),
.Names = c("varA", "varB", "varC", "varD", "varE", "varF", "varG"),
row.names = c(NA, -10L), class = "data.frame"
)
metrics <- c("varB","varC","varF")
eval(
parse( text = paste(metrics,collapse=" * ") ),
envir = X
)
一些解释:
- 粘贴创建一个看起来像 varB * varC * varF 的字符串(折叠用于连接向量的元素)
- 解析是将文本转换为表达式
- eval 与 envir=X 是在 X 内执行表达式
对于您的原始问题,您可以使用 collapse="+"。
编辑:如果您的变量不在 data.frame 中,那么没有 envir 的 eval 就足够了。
edit2:使用上述包中的 rowProds 的示例:
matrixStats::rowProds(as.matrix(X[,metrics])) # convert to a matrix is needed
fUtilities::rowProds(X[,metrics]) # without conversion
我在源代码中挖掘这个函数并且:
- fUtilities 使用 apply,所以这与 apply(X,1,prod) 相同(这不是有效的解决方案)
- matrixStats 很聪明,可以执行类似 exp(rowSums(log(X))) 的操作,因此应该更快。
速度测试:
Xm <- matrix(rnorm(50000*8),ncol=8)
Xd <- as.data.frame(Xm)
require(fUtilities)
require(matrixStats)
system.time( matrixStats::rowProds(as.matrix(Xd)) )
# user system elapsed
# 0.08 0.02 0.09
system.time( matrixStats::rowProds(Xm) )
# user system elapsed
# 0.08 0.00 0.08
system.time( fUtilities::rowProds(Xd) )
# user system elapsed
# 0.52 0.00 0.52
即使转换为矩阵 matrixStats 版本也更快。