【发布时间】:2013-07-19 15:04:53
【问题描述】:
如何使用 sse 内在函数获取浮点向量的总和元素(减少)?
简单的序列号:
void(float *input, float &result, unsigned int NumElems)
{
result = 0;
for(auto i=0; i<NumElems; ++i)
result += input[i];
}
【问题讨论】:
-
你有什么尝试吗?
-
你真的看过生成的代码吗?至少我对 gcc 的经验是,它在可能的情况下在执行 SSE 指令方面做得很好——但它可能需要 -O3。
标签: c++ sum sse simd reduction