【发布时间】:2018-11-29 21:48:19
【问题描述】:
在 GTX 750 上使用 clBuildProgram() 时遇到问题。内核无法构建,错误代码为 -5(CL_OUT_OF_RESOURCES),构建日志为空。
有一个可能的解决方案,即在 clBuildProgram() 中添加“-cl-nv-verbose”作为输入选项。但是,它不适用于所有内核。 基于此,我尝试了另一个优化选项“-cl-opt-disable”。它也适用于某些内核。
然后我就糊涂了。
- 我找不到导致错误的真正原因;
- 为什么不同的构建选项对某些内核有意义?
- 该错误似乎与架构无关。因为相同的 Opencl 代码在 GTX 750 上成功执行,而在 Tesla P100 上失败。
有人有想法吗?
【问题讨论】:
-
另一个问题,我拿了一个简单的opencl基准——矩阵乘法。在没有任何构建选项输入的情况下构建内核。然后我写了一个python脚本来执行它。使用 sudo python script.py 不会出错,但是只使用 python 脚本也会出错。