【问题标题】:Dynamic amount of work in GLSL fragment shaderGLSL 片段着色器中的动态工作量
【发布时间】:2016-05-08 08:01:52
【问题描述】:

我正在开发用于 2D 冲击波的后处理 GLSL (ES) 片段着色器。在一个圆圈中稍微扭曲纹理很容易,它已经适用于单个冲击波。现在我需要同时支持多波,我的想法:

第一个想法:对每个波进行后处理(绑定 FBO -> 绑定先前的纹理 -> 绘制调用)。易于实现,但有很多状态更改和绘图调用。

第二个想法:添加包含所有波的所有信息的数据纹理和带有数字波的单个制服,所以我可以这样做:

uniform int count;
uniform sampler2D dataTex;
const float dataTexSize = 32;
[...]
    vec4 pixel;
    for(int i = 0; i < count; i++)
    {
        vec2 dataTexPos = vec2(i / dataTexSize, 0);
        pixel += shockwave(texture2D(dataTex, dataTexPos));
    }
    pixel /= float(count);
[...]

但显然 GPU 不喜欢带有非常量表达式且驱动程序无法展开的循环。

是否有给着色器“动态工作量”的最佳实践?我的 OpenGL 版本是 2.0 ES。

【问题讨论】:

  • 您可以尝试在您可以访问的任何硬件上分析这两种实现。
  • 问题是,第二个想法根本行不通,因为我无法将带有 for 循环的着色器编译为非常数。我想知道是否有办法做到这一点。
  • "但显然 GPU 不喜欢带有非常数表达式的循环" 不,糟糕的 GPU 不喜欢那样。 ES 2.0 不允许非常量循环,但实际上现代 GPU 完全可以使用它。近十年前,Desktop GL 3.0 放弃了这些要求。在移动领域,GL ES 3.0 放弃了这些要求。
  • 你完全正确。但不幸的是,我仅限于 2.0 ES。

标签: opengl-es glsl fragment-shader


【解决方案1】:

只有少数 ES2.0 GPU(以任何合理的数量提供)不支持片段着色器中的动态循环。我特别知道的两个是 Tegra 2(Android GLSL fragment shader on NVIDIA tegra2 - 但它已经很老了)和 Broadcom VC4(Raspberry Pi 和 Amazon FireTV Stick)。 ES 2.0 规范不需要支持,但正如@Nicol Bolas 提到的,绝大多数移动 GPU 都支持它。因此,如果您不针对任何这些芯片,那么您很可能只使用着色器。

不幸的是,没有 GLES 扩展来宣传对动态循环的支持。你基本上只需要编译一个带有动态循环的着色器,看看它是否成功。如果您的目标不支持它,您可以“伪造”一个动态循环,方法是使用常量循环表达式编译多个着色器,而不是使用统一。例如:

int count = %d;
uniform sampler2D dataTex;
const float dataTexSize = 32;
[...]
    vec4 pixel;
    for(int i = 0; i < count; i++)
    {
        vec2 dataTexPos = vec2(i / dataTexSize, 0);
        pixel += shockwave(texture2D(dataTex, dataTexPos));
    }
    pixel /= float(count);
[...]

每次遇到需要不同循环计数的情况时,将%d 替换为所需的循环计数并编译新着色器。只要count 具有相当少量的可能值,您就不会得到这么多着色器。

【讨论】:

  • 我检查了纹理读/写速率,显然我的桌面 GPU 驱动程序完美地优化了一个带有 const 表达式的 for 循环和一个 dynamic-if。幸运的是,我的目标受众只是桌面用户。谢谢!
猜你喜欢
  • 2017-04-12
  • 1970-01-01
  • 1970-01-01
  • 2021-03-17
  • 2014-07-26
  • 2022-01-20
  • 2020-12-05
  • 2013-07-30
  • 1970-01-01
相关资源
最近更新 更多