【发布时间】:2018-09-11 20:19:29
【问题描述】:
我使用Tim Matterson's lecture notes学习OpenMP,他举了一个虚假共享的例子,如下所示。代码很简单,用于从 4.0/(1+x*x) 的数值积分计算 pi,x 的范围是 0 到 1。代码使用向量来包含 4.0/(1+x*x) 的值对于从 0 到 1 的每个 x,然后在最后对向量求和:
#include <omp.h>
static long num_steps = 100000;
double step;
#define NUM_THREADS 2
void main()
{
int i, nthreads; double pi, sum[NUM_THREADS];
step = 1.0/(double)num_steps;
omp_set_num_threads(NUM_THREADS);
#pragma omp parallel
{
int i, id, nthrds;
double x;
id = omp_get_thread_num();
nthrds = omp_get_num_threads();
if (id == 0) nthreads = nthrds;
for (i=id, sum[id]=0.0; i<num_steps; i=i+nthrds){
x = (i+0.5)*step;
sum[id] += 4.0/(1.0+x*x);
}
}
for (i=0; pi=0.0; i<nthreads;i++) pi += sum[i]*step;
}
我对这个例子中的虚假分享有一些疑问:
- 写入数组的工作在两个线程(即 [thread0,thread1,thread0,thread1,...]如果我们使用
#pragma omp parallel for,那么数组将被划分为[thread0, thread0, thread0, ...., thread1, thread1, thread1, ...],那么我们是否还有错误共享,现在地址是每个线程访问的距离远吗? - 如果我的工作使用
#pragma omp parallel for写入与我的输入向量具有 1 对 1 对应关系的输出向量(例如,输入是预测变量矩阵,输出是预测向量) ,那我什么时候需要担心虚假分享?
【问题讨论】:
标签: parallel-processing openmp false-sharing