【发布时间】:2012-04-19 00:45:24
【问题描述】:
我正在开发一个需要进行大量线性代数计算的程序。
现在我正在使用 LAPACK/BLAS 例程,但我需要利用我的机器(24 核 Xeon X5690)。
我发现了像 pblas 和 scalapack 这样的项目,但它们似乎都专注于分布式计算和使用 MPI。
我没有可用的集群,所有计算都将在单个服务器上完成,使用 MPI 看起来有点矫枉过正。
有人对此有什么建议吗?
【问题讨论】:
-
不要放弃使用 MPI,尤其是当您可以找到支持 MPI 的库来完成繁重的工作时。这可能比查找共享内存线性代数库或编写自己的共享内存代码更容易。一个好的 MPI 实现将在共享内存计算机上高效运行。
-
我知道。我并不是说我会自己编写 MPI 代码。我只是想避免所有使用 MPI 的东西,因为这不是一个集群程序,我想避免任何不必要的开销
-
投票结束作为工具记录/太宽泛。
标签: parallel-processing linear-algebra lapack