【发布时间】:2014-02-10 12:35:10
【问题描述】:
只是为了看看 CUDA 生成什么样的代码,除了目标文件之外,我还喜欢编译为 ptx。由于我的一些循环展开可能需要很长时间,我希望能够编译 *.cu→*.ptx→*.o 而不是浪费时间与两个 *.cu →*.ptx 和 *.cu→*.o,我目前正在这样做。
只需将-ptx 添加到nvcc *.cu 行即可获得所需的ptx 输出。
使用ptxas -c 将*.ptx 编译为*.o 有效,但在我的可执行链接中导致错误:Relocations in generic ELF (EM: 190)。
尝试用nvcc 编译*.ptx 失败静默,什么也不输出。
我需要将一些选项传递给ptxas吗?我应该如何通过单独编译通过 ptx 正确编译?或者,我可以告诉nvcc 保留 ptx 吗?
【问题讨论】: