【发布时间】:2011-12-20 00:59:18
【问题描述】:
我有一个非常简单的程序,我正在尝试提高性能。我知道会有所帮助的一种方法是利用 SSE3(因为我正在工作的机器支持这一点),但我完全不知道如何做到这一点。下面是一段代码sn-p(c++):
int sum1, sum2, sum3, sum4;
for (int i=0; i<length; i+=4) {
for (int j=0; j<length; j+=4) {
sum1 = sum1 + input->value[i][j];
sum2 = sum2 + input->value[i+1][j+1];
sum3 = sum3 + input->value[i+2][j+3];
sum4 = sum4 + input->value[i+3][j+4];
{
}
我已经阅读了一些关于这个的内容,并且理解了这个想法,但我完全不知道如何实现这个。有人可以帮我吗?我认为这很简单,尤其是对于我的简单程序,但有时入门是最难的部分。
谢谢!
【问题讨论】:
标签: c++ performance optimization sse sse3