【问题标题】:Multiple texture units in shader vs multiple semitransparent textured meshes - performance着色器中的多个纹理单元与多个半透明纹理网格 - 性能
【发布时间】:2013-09-09 12:12:15
【问题描述】:

有一个使用 OpenGL ES 2.0 的 2D 场景。我需要绘制一个带有许多半透明纹理(一种噪声)的四边形,它们以不同的相位旋转以模拟类似有机的效果。我假设有两种选择:

  • 绘制一个四边形,使用具有多个采样器的着色器并为每个采样器旋转纹理坐标(例如在顶点着色器中)。
  • 绘制多个重叠和旋转的四边形,将不同的纹理绑定到每个网格(以及更简单的着色程序)。

四边形(或四边形)将使用顶点数组绘制:

glBindVertexArrayOES(vertexArray);

glDrawArrays(GL_TRIANGLE_STRIP, index, numVertex);

第一个选项似乎更有效,因为只有一个网格并且所有混合在片段着色器中完成一次。只有一次调用 glDrawArrays()。

另一方面,第二个选项意味着一个更简单的片段着色器,具有一个纹理查找(但称为 N - 每个四边形的时间)。

在这两个选项中,纹理绑定的数量相同,但在第一个选项中,所有纹理都绑定到不同的纹理单元。

我想知道您对每个选项的性能的看法。

【问题讨论】:

  • “另一方面,第二个选项意味着一个更简单的片段着色器” - 是的,只是这个更简单的片段着色器被执行了多次。
  • 是的,这就是我所说的“(但称为 N - 每个四边形的时间)”的意思。

标签: ios opengl-es


【解决方案1】:

这里毫无疑问,使用多个纹理单元会给您带来更好的性能。一般来说,您的数据需要通过管道完成的行程越少,它们完成的速度就越快。因此,如果您可以将更多操作塞进单个片段着色器中,那么您将获得更大的能力。

您可能会考虑不这样做的唯一原因是,如果您遇到硬件限制,例如使用的临时寄存器或指令槽的数量或纹理图像单元,这些都与您的简单示例无关。即使在能够实现 OpenGL ES 2.0 的最可怜的硬件上,您也可以保证 8 个纹理单元:

  • const mediump int gl_MaxVertexTextureImageUnits = 0; // 顶点纹理查找是可选的
  • const mediump int gl_MaxCombinedTextureImageUnits = 8;
  • const mediump int gl_MaxTextureImageUnits = 8;

ES 2.0 没有每个纹理单元矩阵,但您可以使用统一提供自己的。然后在您的顶点着色器中,您可以将纹理坐标乘以定义旋转的矩阵,并将结果以单独的纹理坐标集的形式传递给片段着色器。在您达到纹理图像单位限制之前,这应该是您首选的做法。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2012-11-12
    • 1970-01-01
    • 2013-04-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-10-24
    • 2014-10-04
    相关资源
    最近更新 更多