【发布时间】:2014-11-08 06:27:03
【问题描述】:
只是出于好奇。 CuBLAS 是一个用于基本矩阵计算的库。但是,这些计算通常也可以很容易地用普通的 Cuda 代码编写,而无需使用 CuBLAS。那么,CuBLAS 库和您自己的 Cuda 程序用于矩阵计算的主要区别是什么?
【问题讨论】:
-
是不是和普通的C代码和CPU上的BLAS库的关系类似,编译器级别的优化呢?但 GPU 本质上是多线程的,所以情况可能与 CPU 上的情况不太一样。说一个矩阵加法。