【发布时间】:2020-09-13 08:48:19
【问题描述】:
我对计算单元有点困惑。我有一个 nvidia gtx 1650Ti 显卡。当我询问 max_compute_units 时,它返回 16 个单位,而 max_work_group_size 为 1024。 但是当我执行内核时:
int i = get_global_id (0);
result [i] = get_local_id (0);
我得到重复的本地 id 范围从 0 到 255。这与显卡返回的 max_compute_units 有什么关系?这是 max_compute_units 值中的错误,并且 gpu 实际上具有比它指示的更多的计算单元吗?还是 OpenCl get_local_id 有自己的分配逻辑,不依赖于硬件?谢谢!
【问题讨论】: