【发布时间】:2013-12-03 18:47:02
【问题描述】:
我一直在阅读this 并行管道教程并注意到,虽然吞吐量肯定存在相当大的差异,但如果压缩阶段也承担读取工作,那岂不是更好,因为它只是反正等着呢?写入阶段也是如此……我的意思是,为什么不进行第三次压缩,然后切换到写入两个,然后让其中一个核心返回压缩,而另一个核心完成第三次写入,然后等等?
如果这很明显,我深表歉意。我想这是标准做法,被称为某种东西,我只是不确定是什么。他们是否会因为这样的换工作而产生任何开销?
而且我知道这可能是最后一个问题的错误论坛,但是 GPU 可以像这样切换工作吗,或者可编程着色器/CUDA 内核在被编程后几乎应该不理会吗?
编辑:我想我也不明白采用 2 核/阶段示例中使用的相同六核如何比只给六个核心中的每一个都提供三个阶段更快。当然,会有两个核心可以做两个,但这仍然比顶级方案更快。在 GPU 的情况下,我会更好地理解它,因为某些计算涉及专门的硬件,但一般来说,我看不到它。也许这个例子很弱或者是什么,因为我知道并行处理会继续存在。
【问题讨论】:
标签: parallel-processing pipeline