【发布时间】:2015-07-22 16:45:22
【问题描述】:
我正在从事一些涉及计算密集型图像处理算法的项目,这些算法涉及许多可以由 BLAS 库(主要是 1 级例程)处理的步骤。由于我的数据非常大,因此考虑使用 BLAS 肯定是有意义的。
我见过一些例子,优化的 BLAS 库极大地提高了性能(矩阵矩阵乘法的 10 倍加速并不罕见)。
我应该尽可能应用 BLAS 功能并盲目相信它会产生更好的性能,还是应该逐个案例分析并仅在必要时应用 BLAS?
盲目地应用 BLAS 的好处是我现在可以节省一些时间,因为我不必详细分析我的代码。另一方面,仔细分析每种方法可能会给我最好的性能,但我想知道现在是否值得花几个小时来获得半秒后运行软件的时间。
【问题讨论】:
标签: blas