【发布时间】:2016-11-28 22:01:04
【问题描述】:
计算 n x m 矩阵对具有 m 个条目的向量的作用的简单方法会导致代码像 O(n x m) 一样缩放。
我知道使用 BLAS 例程对于此类计算是一个不错的选择,但它们是否也比 O(n x m) 更好地扩展?还是它们只是比简单的方法更快但具有相同的缩放比例?
【问题讨论】:
标签: matrix-multiplication blas
计算 n x m 矩阵对具有 m 个条目的向量的作用的简单方法会导致代码像 O(n x m) 一样缩放。
我知道使用 BLAS 例程对于此类计算是一个不错的选择,但它们是否也比 O(n x m) 更好地扩展?还是它们只是比简单的方法更快但具有相同的缩放比例?
【问题讨论】:
标签: matrix-multiplication blas
相同的缩放比例。优化的 BLAS 通常更快。有时速度相同,因为具有正确编译选项的良好编译器可以优化幼稚的 for 循环。这是 BLAS 2 级运算(例如矩阵向量乘法)的情况。
【讨论】: