3.2 逐步性能提升

本书的示例表明,通过提交更多的活动和优化数据传输,使用性能分析驱动的开发可不断提升OpenACC应用程序的性能。图3-2列出了优化混合应用遵循的模式。

《OpenACC并行程序设计:性能优化实践指南》一 3.2 逐步性能提升

从应用准备开始性能优化周期,然后进行实际的性能测量,并对性能数据进行分析。基于这些数据,编程开发人员尝试减少性能问题,并重新开始整个过程。
下面使用Score-P和Vampri讲解性能提升周期里的前三步,以CUDA加速粒子单元模拟为例,其中CUDA部分代码很容易用OpenACC实现代替来获得同样的结果。此外,还引入了各种优化步骤,突出了更普遍适用的性能调优选项。

相关文章:

  • 2021-07-05
  • 2021-09-27
  • 2021-08-05
  • 2021-08-08
  • 2021-04-30
  • 2021-07-18
  • 2021-04-04
  • 2021-09-10
猜你喜欢
  • 2021-11-26
  • 2021-12-17
  • 2021-10-04
  • 2021-10-01
  • 2021-08-01
  • 2021-06-15
  • 2021-08-02
相关资源
相似解决方案