【发布时间】:2017-03-19 07:33:05
【问题描述】:
This link 说 cuBLAS-XT 例程提供核外操作——操作数数据的大小仅受系统内存大小的限制,不受 GPU 板载内存大小的限制。这意味着只要输入数据可以存储在 CPU 内存中并且输出大小大于 GPU 内存大小,我们就可以使用 cuBLAS-XT 函数,对吗?
另一方面,this link 说“在非常大的问题的情况下,cublasXt API 提供了将一些计算卸载到主机 CPU 的可能性”和“目前,只有例程 cublasXtgemm() 支持这个特征。对于输入大小大于 CPU 内存大小的问题是否存在这种情况?
我不明白这两者之间的区别!如果有人帮助我理解其中的区别,我将不胜感激。
【问题讨论】: