【发布时间】:2018-08-27 18:24:46
【问题描述】:
cudnn_samples_v7 中的 RNN 示例 (RNN_example.cu) 设置为使用 CUDNN_DATA_FLOAT。我想修改它以使用CUDNN_DATA_INT8。当我在全局范围内进行此更改、编译和运行时,出现以下运行时错误:
$ ./RNN_int8 20 2 512 64 0
cuDNN Error: CUDNN_STATUS_NOT_SUPPORTED RNN_example_int8.cu 285
cuDNN Error: CUDNN_STATUS_NOT_SUPPORTED RNN_example_int8.cu 302
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 309
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 310
cuDNN Error: CUDNN_STATUS_NOT_SUPPORTED RNN_example_int8.cu 326
cuDNN Error: CUDNN_STATUS_NOT_SUPPORTED RNN_example_int8.cu 328
CUDA Error: out of memory RNN_example_int8.cu 330
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 373
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 402
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 373
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 402
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 373
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 402
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 373
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 402
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 482
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 516
cuDNN Error: CUDNN_STATUS_BAD_PARAM RNN_example_int8.cu 541
比如第309行的错误就是运行这段代码:
cudnnErrCheck(cudnnSetFilterNdDescriptor(wDesc, CUDNN_DATA_INT8, CUDNN_TENSOR_NCHW, 3, dimW));
我怀疑格式类型 (CUDNN_TENSOR_HCHW) 对于数据类型不正确 - 这是正确的假设吗?如果有,这里需要什么格式?
【问题讨论】:
-
我建议提供minimal reproducible example。请参阅第 1 项here。除其他要求外,int8 还需要硬件中适当的底层支持。您可能还只想在 developer guide 中搜索 int8 的每个实例。
-
我根据 CUDNN_STATUS_NOT_SUPPORTED 得出结论,这些 RNN 模型 API 调用不支持 CUDNN_DATA_INT8,尽管 Nvidia 文档没有规定任何此类限制。哦,如果只有 CuDNN 是开源的,那么我可以看看代码并确定。