一、相关概念
多个线程组成线程块,多个线程块组成网格,网络约等于kernel。而kernel是GPU处理的最小单元,可以理解成是一个函数。如下图:
CPU和GPU硬件对比:
CPU和GPU编程:
二、高效策略
根据公式,有以下五种方式:
高效策略-合并全局内存
其他方式-避免线程发散:
其他方式-避免循环长度不一样
多个线程组成线程块,多个线程块组成网格,网络约等于kernel。而kernel是GPU处理的最小单元,可以理解成是一个函数。如下图:
CPU和GPU硬件对比:
CPU和GPU编程:
根据公式,有以下五种方式:
高效策略-合并全局内存
其他方式-避免线程发散:
其他方式-避免循环长度不一样
相关文章: