【问题标题】:openMP - concurrent access to variables and atomicopenMP - 并发访问变量和原子
【发布时间】:2012-04-27 13:06:50
【问题描述】:

我想用 openMP 并行化一个对盒子进行采样的函数(在盒子中随机选择点,并在这些点评估给定函数)。我写了以下代码。

//storing points
double** points_ = new double*[N-m];
for(int i=0;i<N-m;i++)
{
    points_[i]=new double[ndim];
}
double* evals_ = new double[N-m];

#pragma omp parallel for 
for(int i=0;i<N-m;i++)
{
    double* pt_ = randomPoint(lower,upper);
    for(int k=0;k<ndim;k++)
    {
        points_[i][k]=pt_[k];
    }
    evals_[i]=evalFunc(pt_);
    delete pt_;
}

但是,我对这段代码没有信心:evals_ 和 points_ 在每个线程中更新。我想在那里添加一些原子语句:

#pragma omp parallel for 
for(int i=0;i<N-m;i++)
{
    double* pt_ = randomPoint(m_lower,m_upper);
    for(int k=0;k<m_ndim;k++)
    {
        #pragma omp atomic update
        points_[i][k]=pt_[k];
    }
    #pragma omp atomic update
    evals_[i]=evalFunc(pt_);
    delete pt_;
}

但我担心这会非常低效:您有什么建议可以更准确地编写它吗?而且...这不是编译...(错误:#pragma omp atomic 之后的表达式形式不正确)虽然我可以在 openMP 规范 A22 中找到该示例

void atomic_example(float *x, float *y, int *index, int n)
{
    int i;
    #pragma omp parallel for shared(x, y, index, n)
    for (i=0; i<n; i++) {
    #pragma omp atomic update
    x[index[i]] += work1(i);
    y[i] += work2(i);
    }
}

原子更新之后也是对数组的影响。

感谢和问候。

编辑--------

我同意都铎的回答。不过好像这里的这个例子,在另外一段并行化的代码中确实需要原子性:在sum_+=...这一行,出现错误(并发访问)

for(i=0;i<m_ndim;i++)
{
    double sum_=0;
    #pragma omp parallel reduction(+:sum_)
    for(j=0;j<m_npts;j++)
    {
        sum_ += set_[j][i];
    }
    Sum_[i] = sum_;
}

为什么需要它?还是有什么问题?

【问题讨论】:

    标签: c++ multithreading multiprocessing openmp


    【解决方案1】:

    您的代码中不需要任何原子子句。

    原因是外部循环在索引i 上进行拆分,因此每个线程将从points_eval_ 中获取一组元素,这些元素不会与另一个线程的工作集重叠。

    evals_ 是一个数组,所以每个线程都会得到一个连续的子数组(由于隐式静态调度方案),例如

    0 1 2 3 . 4 5 6 7 . 8 9 10 11...
       t1        t2        t3
    

    points_ 是一个二维矩阵,每个线程都会得到一组连续的行:

       0 
       1
    t1 2
       3
       .
       4
       5
    t2 6
       7
       .
       8
       9
    t3 10
       11
       ...
    

    在第二种情况下,k 的值似乎有重叠,因为每个线程具有相同的 k 范围,但更新的点落在不同的行上(索引 i) ,如上所示,不同线程不重叠。

    【讨论】:

    • 我同意!但是,现在我不明白为什么代码的另一部分(我用这个示例在上面编辑了我的帖子)崩溃了,告诉我在sum_+=set_[j][i] 行中有并发访问。谢谢!
    • @dlib:不应该是#pragma omp parallel for reduction...吗?您似乎错过了for,它为计算提供了完全不同的语义。
    猜你喜欢
    • 2014-03-02
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-11-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-03-09
    相关资源
    最近更新 更多