了解移动语义与模板元编程的好处答案

【问题标题】：Understanding the benefits of move semantics vs template metaprogramming了解移动语义与模板元编程的好处
【发布时间】：2012-05-30 07:37:13
【问题描述】：

我已经阅读了一些关于 C++11 中移动语义的描述，我想知道它可以在什么上下文中使用。目前，许多 C++ 数学库使用模板元编程来延迟计算。

如果 M = A + B + C*D，其中 M、A、B、C 和 D 是矩阵，模板元编程允许避免无用的副本。移动语义是一种更方便的方式来做这些事情吗？

如果不是，在什么上下文中使用移动语义。如果是，与模板元编程相比，这种用途有什么区别/限制？

【问题讨论】：

元编程与延迟评估完全相反。一个有趣的问题，但您的想法的样本会有所帮助。
我认为这两种方法之间的差异不会很大，但我认为右值引用会使库更容易和更清晰。推测>
@MooingDuck：表达式模板有时不仅可以消除副本。例如在A*B+C 表达式中，表达式模板可以通过插入 FMA 指令等来优化计算。
@AndréCaron：我知道这一点，但我推测使用右值引用编写这样的野兽可能比 TMP 更容易编写代码。霍华德澄清了右值在这种情况下如何没有帮助。

标签： c++ templates c++11 move-semantics

【解决方案1】：

我相信你所说的“模板元编程”更准确的术语是expression templates。

如果您的矩阵动态分配其数据，则移动语义可以帮助将数据从一个对象传输到另一个对象（包括到/从临时对象），例如：

M = A + B + C*D

另一方面，表达式模板将完全消除临时变量。

如果您的矩阵没有动态分配它们的数据（例如，如果它们是固定大小且很小的），则移动语义对您的性能毫无帮助。

将表达式模板应用于矩阵库将获得最高性能。这也是一个非常困难的实现技术。移动语义要容易得多实现，并且可以在表达式模板之外完成（如果有可以转移的内存等资源）。

总结：

移动语义不会消除临时内存，而是会在临时内存之间转移动态分配的内存，而不是重新分配内存。

表达式模板消除了临时性。

【讨论】：

【解决方案2】：

我不是这些优化方面的专家，但据我了解，您所说的延迟评估技术通过在矩阵类型上定义算术运算符来工作，例如 A+B+C*D 不返回矩阵，它返回一个可以转换为矩阵的代理对象。当它被分配给M 时会发生这种情况，并且转换代码将通过库设计者可以想出的最有效的方式计算结果矩阵的每个单元格，避免临时矩阵对象。

那么，假设程序包含M = A + B + C * D;

如果您除了使用operator+= 以通常的方式实现operator+ 之外没有做任何聪明的事情，那么您会在正常情况下得到类似的东西，C++03 风格的复制省略已经开始了：

Matrix tmp1 = C;
tmp1 *= D;
Matrix tmp2 = A;
tmp2 += B;
tmp2 += tmp1;
M = tmp2;

使用延迟评估，您可能会得到类似的结果：

for (int i = 0; i < M.rows; ++i) {
    for (int j = 0; j < M.cols; ++j) {
        /* not necessarily the best matrix multiplication, but serves to illustrate */
        c_times_d = 0;
        for (int k = 0; k < C.cols; ++k) {
            c_times_d += C[i][k] * D[k][j];
        }
        M[i][j] = A[i][j] + B[i][j] + c_times_d;
    }
}

而“没什么聪明”的代码会做几个单独的加法循环和更多的赋值。

据我所知，在这种情况下，移动语义并没有多大帮助。你所写的内容中没有任何内容允许我们从 A、B、C 或 D 转移，所以我们最终会得到相当于：

Matrix tmp1 = C;
tmp1 *= D;
Matrix tmp2 = A;
tmp2 += B;
tmp2 += std::move(tmp1);
M = std::move(tmp2);

所以移动语义除了最后一点之外没有任何帮助，也许右值版本的操作符比普通的更好。如果你写了std::move(A) + std::move(B) + std::move(C) * std::move(D)，还有更多可用的，因为我们不必从C 或A 复制，但我仍然认为结果不如延迟评估代码。

基本上，移动语义对延迟评估提供的优化的一些重要部分没有帮助：

1) 通过延迟评估，中间结果永远不需要实际作为完整矩阵存在。移动语义不会使编译器免于在某些时候在内存中创建完整的矩阵A+B。

2) 通过延迟评估，我们可以在计算完整个表达式之前开始修改M。移动语义无助于编译器重新排序修改：即使编译器足够聪明地发现潜在机会，如果存在任何危险，对非临时变量的修改必须保持正确的顺序抛出异常，因为如果 A + B + C * D 的任何部分抛出，那么 M 必须保持原样。

【讨论】：

【解决方案3】：

他们是两种不同的野兽。移动语义是关于从将要被销毁的值中分配资源。当与诸如大整数（需要动态内存分配）的表达式模板混合时，人们会简单地使用这样的内存，而不是复制即将被销毁的东西。

移动语义对于本质上不可可复制的对象（如fstreams）也很重要，但使其可移动是有意义的。

【讨论】：

【解决方案4】：

移动语义适用于对象内管理的资源，用于避免在创建临时对象时不必要地获取/释放资源（例如，动态分配的内存是一种资源）。

模板元编程对分配在堆栈上的结构进行操作（因为它需要对操作数进行编译时评估）。您可以使用它来避免可以在编译时计算的操作的运行时计算

【讨论】：

【解决方案5】：

移动语义是动态的，表达式模板不是。您不能对分布在多个语句中的表达式进行表达式模板化，并且其中一些仅在月亮是蓝色时才被评估，而移动语义可以。

【讨论】：