【发布时间】:2023-04-03 08:23:01
【问题描述】:
我有一些关于 cuda 寄存器内存的问题
1) 有没有办法释放 cuda 内核中的寄存器?我在寄存器中有变量、一维和二维数组。 (最大数组大小 48)
2)如果我使用device函数,那么我在device函数中使用的寄存器在执行后会发生什么?它们是否可用于调用内核执行或其他设备功能?
3) nvcc 如何优化寄存器使用?请分享内存密集型内核优化的重要要点
PS:我有一个复杂的算法可以移植到 cuda,它需要大量寄存器进行计算,我试图弄清楚是将中间数据存储在寄存器中并编写一个内核还是将其存储在全局内存中并中断算法在多个内核中。
【问题讨论】:
标签: cuda