【问题标题】:How am I able to run Tensor Core instructions without actually having Tensor Cores?在没有实际张量核心的情况下,我如何能够运行张量核心指令?
【发布时间】:2021-06-11 18:15:48
【问题描述】:

我正在使用 CUDA 的 WMMA API 在 GTX 1660 Ti 上增加片段。这个 GPU 没有张量核心,但是当我查看为我的代码生成的 SASS 时,我看到了 HMMA.1688.F32 指令,它们是张量核心指令!怎么会这样?

相关信息:

【问题讨论】:

    标签: cuda gpu nvidia hardware


    【解决方案1】:

    为了代码二进制兼容性,图灵家族的“非张量核心”成员拥有hardware in the SM,它将处理张量核心指令,尽管与张量核心单元相比,吞吐量相对较低。

    【讨论】:

      猜你喜欢
      • 2018-08-12
      • 2019-06-10
      • 1970-01-01
      • 2020-01-09
      • 2021-11-02
      • 2023-04-02
      • 2018-04-30
      • 2022-07-13
      • 2021-12-28
      相关资源
      最近更新 更多