【发布时间】:2016-02-06 13:39:15
【问题描述】:
我最近一直在研究一个相当广泛的程序,我目前正处于必须利用矩阵乘法的地步。问题是,对于这个特定的程序,速度至关重要。我熟悉许多矩阵设置,但我想知道哪种方法运行速度最快。我进行了广泛的研究,但结果很少。下面是我熟悉的矩阵乘法算法列表:
- 迭代算法
- 分而治之算法
- 次立方算法
- 共享内存并行
如果有人需要澄清我列出的方法或一般问题,请随时提出。
【问题讨论】:
-
A:由对执行代码的处理器架构具有详细知识和经验的专家开发的手动调优库;换句话说,不要自己动手,乞求借用或窃取实现。哦,或者真的买一个。
-
这个问题太笼统了。您的矩阵可以是大的、小的、稀疏的、密集的……对于每个上下文都没有最好的算法。请注意,共享内存并行不是一种算法,根据您所使用的并行架构,有些算法的表现会更好或更差。