【问题标题】:NVCC separate compilation with PTX output带 PTX 输出的 NVCC 单独编译
【发布时间】:2014-02-10 12:35:10
【问题描述】:

只是为了看看 CUDA 生成什么样的代码,除了目标文件之外,我还喜欢编译为 ptx。由于我的一些循环展开可能需要很长时间,我希望能够编译 *.cu*.ptx*.o 而不是浪费时间与两个 *.cu*.ptx*.cu*.o,我目前正在这样做。

只需将-ptx 添加到nvcc *.cu 行即可获得所需的ptx 输出。

使用ptxas -c*.ptx 编译为*.o 有效,但在我的可执行链接中导致错误:Relocations in generic ELF (EM: 190)

尝试用nvcc 编译*.ptx 失败静默,什么也不输出。

this image is quite helpful:

我需要将一些选项传递给ptxas吗?我应该如何通过单独编译通过 ptx 正确编译?或者,我可以告诉nvcc 保留 ptx 吗?

【问题讨论】:

    标签: gcc cuda nvcc ptxas


    【解决方案1】:

    或者,我可以告诉 nvcc 保留 ptx 吗?

    是的,您可以将 nvcc 告诉 keep all intermediate files,其中之一将是 .ptx 文件。

    nvcc -keep ...
    

    保留所有中间文件有点乱,但我相信你可以想出一个脚本来整理东西,只保存你想要的文件。

    【讨论】:

      猜你喜欢
      • 2014-11-29
      • 2020-07-12
      • 2011-12-03
      • 2019-01-17
      • 2015-11-03
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2010-10-05
      相关资源
      最近更新 更多