使用 SSE 对数组进行索引答案

【问题标题】：indexing into an array with SSE使用 SSE 对数组进行索引
【发布时间】：2011-05-27 21:32:11
【问题描述】：

假设我有一个数组：

uint8_t arr[256];

和一个元素

__m128i x

包含 16 个字节，

x_1, x_2, ... x_16

我想有效地填充一个新的__m128i 元素

__m128i y

来自arr 的值取决于x 中的值，例如：

y_1  = arr[x_1]
y_2  = arr[x_2]
   .
   .
   .
y_16 = arr[x_16]

实现这一点的命令本质上是从一组不连续的内存位置加载一个寄存器。我对看过这样一个命令的文档有一种痛苦的模糊记忆，但现在找不到了。它存在吗？提前感谢您的帮助。

【问题讨论】：

标签： c sse simd

【解决方案1】：

SIMD 架构中的这种功能称为加载/存储分散/收集。不幸的是，SSE 没有。英特尔未来的 SIMD 架构可能会有这种情况——命运多舛的 Larrabee 处理器就是一个很好的例子。目前，您只需要以不需要这种功能的方式设计数据结构。

请注意，您可以通过使用例如_mm_set_epi8：

y = _mm_set_epi8(arr[x_16], arr[x_15], arr[x_14], ..., arr[x_1]);

当然，这只会生成一堆标量代码来加载您的 y 向量。如果您在任何性能关键循环之外执行此类操作，这很好，例如作为循环之前初始化的一部分，但在循环内部它可能会成为性能杀手。

【讨论】：