加快 R 循环中的 Rcpp 评估答案

【问题标题】：Speed up Rcpp evaluations within R loop加快 R 循环中的 Rcpp 评估
【发布时间】：2020-11-25 09:23:49
【问题描述】：

众所周知，Rcpp 中的实现通常比 R 中的实现要快得多。我感兴趣的是是否有好的做法可以加快对必须在其中进行评估的 Rcpp 函数的单一评估一个 R 循环。

考虑以下示例，我在 Rcpp 中使用了一个简单的多元正态生成函数：

#include <RcppArmadillo.h>

// [[Rcpp::depends(RcppArmadillo)]]

using namespace arma; 
using namespace Rcpp;

// [[Rcpp::export]]
mat mvrnormArma(int n, mat sigma) {
   int ncols = sigma.n_cols;
   mat Y = randn(n, ncols);
   return Y * chol(sigma);
}

假设目标是使用以下两个函数生成 10,000 个 10 维多元正态变量：

PureRcpp = function(n){mvrnormArma(n, diag(10))}
LoopRcpp = function(n){for(ii in 1:n){mvrnormArma(1, diag(10))}}

在这里，PureRcpp 当然是更可取且更快的解决方案。但是，在某些应用程序中，可能需要在 R 循环中依赖 mvrnormArma 的单个评估。这是LoopRcpp 中采用的方法，这肯定是较慢的解决方案。然而，当我对这些进行基准测试并看到第二个解决方案的速度有多慢时，我有点惊讶：

> microbenchmark::microbenchmark(PureRcpp(10000), LoopRcpp(10000))
Unit: milliseconds
            expr       min        lq      mean    median        uq      max neval cld
 PureRcpp(10000)  2.236624  2.365988  2.578869  2.435268  2.565488 10.79609   100  a 
 LoopRcpp(10000) 52.590143 53.315655 58.080897 55.406020 62.264711 80.96275   100   b

当我们必须在 R 循环中工作时，这种巨大的减速是我们必须忍受的，还是有一些可能性可以减少循环导致的开销？我知道我们可以用 C++ 重写所有内容，但目标是尽可能提供快速的“R 循环中的 Rcpp”解决方案。

【问题讨论】：

这里你只需要了解一件事：R 中的循环并不慢。函数调用很慢，特别是如果这些函数是闭包（即is.primitive 为它们返回FALSE）。现在比较两种方法的 R 函数调用次数。
指出，谢谢！

标签： r loops rcpp

【解决方案1】：

正如 Roland 指出的那样，这主要是由于函数调用。但是，您可以通过优化/调整代码来节省一些时间（并获得更准确的比较）。

通过引用传递给 Cpp 函数
不要在循环中创建对角线
在单次调度中使用向量
绘制矢量化随机数

// [[Rcpp::export]]
mat draw_randn(int n, int ncols) {
  mat Y = randn(n, ncols);
  return(Y);
}
// [[Rcpp::export]]
mat mvrnormArma(mat sigma, mat Y) {
  return Y * chol(sigma);
}
// [[Rcpp::export]]
mat mvrnormArma_loop(mat& sigma, rowvec& Y) {
  return Y * chol(sigma);
}

并以此为基准。

PureRcpp = function(n) {
  Y <- draw_randn(n, 10)
  I <- diag(10)
  mvrnormArma(I, Y)
}
LoopRcpp = function(n) {
  Y <- draw_randn(n, 10)
  I <- diag(10)
  for(ii in 1:n) {mvrnormArma_loop(I, Y[ii, ])}
}

为我节省了大约 10 毫秒。

【讨论】：