原视频

一、相关概念

多个线程组成线程块,多个线程块组成网格,网络约等于kernel。而kernel是GPU处理的最小单元,可以理解成是一个函数。如下图:

cuda编程(2):软硬件编程模型以及高效策略

CPU和GPU硬件对比:

cuda编程(2):软硬件编程模型以及高效策略

CPU和GPU编程:

cuda编程(2):软硬件编程模型以及高效策略

二、高效策略

根据公式,有以下五种方式:

cuda编程(2):软硬件编程模型以及高效策略

高效策略-合并全局内存

cuda编程(2):软硬件编程模型以及高效策略

其他方式-避免线程发散:

cuda编程(2):软硬件编程模型以及高效策略

其他方式-避免循环长度不一样

cuda编程(2):软硬件编程模型以及高效策略

 

相关文章:

  • 2021-10-28
  • 2021-06-02
  • 2022-12-23
  • 2022-12-23
  • 2021-12-16
  • 2021-05-24
  • 2022-12-23
  • 2021-06-24
猜你喜欢
  • 2021-11-20
  • 2021-10-10
  • 2021-11-24
  • 2021-08-29
  • 2021-06-08
  • 2021-05-29
  • 2021-10-23
相关资源
相似解决方案