【发布时间】:2016-02-12 01:01:33
【问题描述】:
我正在编写一个执行 cuda 内核的头库。我想知道是否有办法绕过 >> 语法,或者从 nvcc 获取 C 源代码输出?
【问题讨论】:
-
您可以通过将内核编译成 CUBIN 或 PTX 文件来避免调用 nvcc,并使用驱动程序 API 加载并执行它,最终将运行时 API 的
<<<...>>>语法调用替换为致电cuLaunchKernel。 (如果这足够了,我会详细说明一下并将其转换为答案) -
一句话回答就是“使用CUDA驱动API”。
-
谢谢,这正是我想要的!