【问题标题】:Scaling of BLAS routinesBLAS 例程的缩放
【发布时间】:2016-11-28 22:01:04
【问题描述】:

计算 n x m 矩阵对具有 m 个条目的向量的作用的简单方法会导致代码像 O(n x m) 一样缩放。

我知道使用 BLAS 例程对于此类计算是一个不错的选择,但它们是否也比 O(n x m) 更好地扩展?还是它们只是比简单的方法更快但具有相同的缩放比例?

【问题讨论】:

    标签: matrix-multiplication blas


    【解决方案1】:

    相同的缩放比例。优化的 BLAS 通常更快。有时速度相同,因为具有正确编译选项的良好编译器可以优化幼稚的 for 循环。这是 BLAS 2 级运算(例如矩阵向量乘法)的情况。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2011-09-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-02-27
      • 1970-01-01
      相关资源
      最近更新 更多