希望这将消除一些误解,并让您更好地了解通用着色器存储的设置方式。
您必须了解缓冲区对象在 GL 中的实际工作方式。你经常听到人们区分“顶点缓冲区对象”和“统一缓冲区对象”。实际上,没有根本的区别——缓冲区对象无论存储什么,都以相同的方式处理。它只是一个通用数据存储,只有在绑定到特定点时才具有特殊含义(例如GL_ARRAY_BUFFER 或GL_UNIFORM_BUFFER)。
不要考虑驻留在 GPU 上的特殊用途的顶点缓冲区,而是更笼统地考虑 - 它实际上是未格式化的内存,如果您知道结构,您可以读取/写入。像glVertexAttribPointer (...) 这样的调用描述了缓冲区对象的数据结构,足以让glDrawArrays (...) 为每个顶点着色器调用从缓冲区对象的内存中有意义地提取顶点属性。
您需要自己为计算着色器执行相同的操作,如下所示。您需要熟悉7.6.2.2 - Standard Uniform Block Layout 中讨论的规则才能完全理解以下数据结构。
使用 Shader Storage Blocks 描述顶点数据结构可以这样完成:
// Compute Shader SSB Data Structure and Buffer Definition
struct VtxData {
vec4 vtx_pos; // 4N [GOOD] -- Largest base alignment
vec3 vtx_normal; // 3N [BAD]
float vtx_padding7; // N (such that vtx_st begins on a 2N boundary)
vec2 vtx_st; // 2N [BAD]
vec2 vtx_padding10; // 2N (in order to align the entire thing to 4N)
}; // ^^ 12 * sizeof (GLfloat) per-vtx
// std140 is pretty important here, it is the only way to guarantee the data
// structure is aligned as described above and that the stride between
// elements in verts[] is 0.
layout (std140, binding = 1) buffer VertexBuffer {
VtxData verts [];
};
这允许您在计算着色器中使用交错的顶点缓冲区,并使用上面定义的数据结构。执行此操作时,您必须小心数据对齐...您通常可以随意对交错的顶点数组使用您想要的任何对齐/步幅,但在这里您要符合 std140 布局规则。这意味着使用三分量向量并不总是明智地使用内存。您需要在 N (float)、2N (vec2) 或 4N (vec3/vec4) 边界上对齐,这通常需要插入填充和/或巧妙地打包数据。在上面的示例中,您可以在对齐填充浪费的所有空间中拟合整个 3 分量向量的数据。
显示缓冲区将如何创建和绑定以供双重用途的伪代码:
struct Vertex {
GLfloat pos [4];
GLfloat normal [3];
GLfloat padding7;
GLfloat st [2];
GLfloat padding10 [2];
} *verts;
[... code to allocate and fill verts ...]
GLuint vbo;
glGenBuffers (1, &vbo);
glBindBuffer (GL_ARRAY_BUFFER, vbo);
glBufferData (GL_ARRAY_BUFFER, sizeof (Vertex) * num_verts, verts, GL_STATIC_DRAW);
glVertexAttribPointer (0, 4, GL_FLOAT, GL_FALSE, 48, 0); // Vertex Attrib. 0
glVertexAttribPointer (1, 3, GL_FLOAT, GL_FALSE, 48, 16); // Vertex Attrib. 1
glVertexAttribPointer (2, 2, GL_FLOAT, GL_FALSE, 48, 32); // Vertex Attrib. 2
glBindBufferBase (GL_SHADER_STORAGE_BUFFER, 1, vbo); // Buffer Binding 1