【发布时间】:2015-08-12 20:56:08
【问题描述】:
我正在尝试学习如何使用多线程,然后我编写了一个代码(见下文)。正如预期的那样,并行函数需要2.6s,而非并行需要6.4s。
然后我尝试使用 gcc 提供的优化 -O3 来修改编译。这样,非并行函数耗时0s,并行函数耗时2s!表明 -O3 没有作用于并行函数。
为什么优化级别对线程不起作用?有什么根本问题吗?我是不是做错了什么?
按照代码:
#include <iostream>
#include <ctime>
#include <cmath>
#include <vector>
#include <thread>
using namespace std;
#define N 1E8
#define num_sum std::thread::hardware_concurrency()
void fS(void){
double sum;
int i;
for(i=0;i<N;i++){
sum += sin(i*0.1);
}
// cout << endl << sum << endl;
return;
}
void fS_N(vector<double>& sum,int j){
int i;
int imin,imax,intervalo;
intervalo = N/num_sum;
imin = j*intervalo;
imax = (j+1)*intervalo;
for(i=imin;i<imax;i++){
sum[j] += sin(i*0.1);
}
return;
}
int main(){
clock_t t;
cout << "# disponiveis de nos/cpu: " << num_sum << endl;
//no parallel
t = clock();
fS();
t = clock()-t;
cout << "\n Time (no parallel):";
cout << ((double)t)/CLOCKS_PER_SEC << endl;
//parallel
t = clock();
vector<thread> allsum;
vector<double> Svalue(num_sum,0.);
int j;
for(j = 0; j<num_sum; j++){
allsum.push_back(thread (fS_N, ref(Svalue),j) );
}
for(auto &t : allsum){
t.join();
}
double Soma=0.;
for (j=0;j<num_sum;j++){
Soma += Svalue[j];
}
// cout << Soma << endl;
t = clock()-t;
cout << "\n Time (parallel):";
cout << ((double)t)/CLOCKS_PER_SEC << endl;
return 0;
}
【问题讨论】:
-
当任何东西都为 0 时,你应该开始怀疑。您的基准无效。
-
嗯,0 的意思是 10^-5。 (我可以修改程序以显式生成它,但这不是重点)
-
在
fS()函数中,您计算一个从未使用过的总和。优化器足够聪明,不会计算未使用的值。 -
rs,嗯,最后 0 正是重点。
标签: c++ multithreading gcc parallel-processing compiler-optimization