【发布时间】:2013-02-21 19:08:30
【问题描述】:
当我在 OpenCL 中有一个内存缓冲区时,我知道我需要将其中的数据对齐到 16 字节边界。
但是,如果我的整个数据(不是数据结构,实际的数据集合)只有 15 个字节大,我该怎么办?
我应该将它放入 16 字节的大缓冲区还是 15 字节的大缓冲区?
有性能差异吗?
【问题讨论】:
-
那么,您正在运行一个只有 15 字节输入的内核?那是一个不好的例子。如果您运行的 X*16+Y 字节不是 16 的倍数,则更合理。
-
是的,数据大于 15 个字节。但不是 16 的倍数。
标签: memory opencl padding memory-alignment