【发布时间】:2016-02-17 16:32:43
【问题描述】:
根据 OpenMP 规范 (v4.0),由于i 的不同步读/写,以下程序包含可能的数据竞争:
int i{0}; // std::atomic<int> i{0};
void write() {
// #pragma omp atomic write // seq_cst
i = 1;
}
int read() {
int j;
// #pragma omp atomic read // seq_cst
j = i;
return j;
}
int main() {
#pragma omp parallel
{ /* code that calls both write() and read() */ }
}
我想到的可能解决方案在代码中显示为 cmets:
- 用
#pragma omp atomic write/read保护i的读写, - 用
#pragma omp atomic write/read seq_cst保护i的读写, - 使用
std::atomic<int>而不是int作为i的类型。
以下是 x86_64 上编译器生成的指令(在所有情况下都使用 -O2):
GNU g++ 4.9.2: i = 1; j = i;
original code: MOV MOV
#pragma omp atomic: MOV MOV
// #pragma omp atomic seq_cst: MOV MOV
#pragma omp atomic seq_cst: MOV+MFENCE MOV (see UPDATE)
std::atomic<int>: MOV+MFENCE MOV
clang++ 3.5.0: i = 1; j = i;
original code: MOV MOV
#pragma omp atomic: MOV MOV
#pragma omp atomic seq_cst: MOV MOV
std::atomic<int>: XCHG MOV
Intel icpc 16.0.1: i = 1; j = i;
original code: MOV MOV
#pragma omp atomic: * *
#pragma omp atomic seq_cst: * *
std::atomic<int>: XCHG MOV
* Multiple instructions with calls to __kmpc_atomic_xxx functions.
我想知道为什么 GNU/clang 编译器不会为 #pragma omp atomic 写入生成任何特殊指令。我希望有与std::atomic 类似的说明,即MOV+MFENCE 或XCHG。有什么解释吗?
更新
g++ 5.3.0 为#pragma omp atomic write seq_cst 生成MFENCE。这是正确的行为,我相信。没有seq_cst,它会产生普通的MOV,这对于非SC原子性来说已经足够了。
我的 Makefile 中有一个错误,g++ 4.9.2 也会为 CS 原子写入生成 MFENCE。对不起,伙计们。
Clang 3.5.0 没有实现 OpenMP SC 原子,感谢 Hristo Iliev 指出这一点。
【问题讨论】:
-
我的 GCC 4.9.2 在
movl $1, i(%rip)之后立即生成一个mfence,用于顺序一致的原子写入。 -
另外,Clang 3.5.0 仅支持常规的非顺序一致的原子。它甚至没有完整的 OpenMP 3.1 支持 - 请参阅 here。
-
您的 GCC 4.9.2 为 OpenMP SC 原子写入生成
mfence?也就是说,i的类型是int?我的 GCC 仅适用于std::atomic<int>。 -
我刚刚意识到 g++ 5.3.0 为 SC OpenMP 原子写入生成
mfence。所以,问题出在(我的)g++ 4.9.2 上。 -
我想知道你的 4.9.2 和我的 4.9.2 有什么不同。我怀疑 GCC 中的机器规格可能会有所不同。您使用的是什么操作系统和发行版?
标签: c++ openmp x86-64 atomic memory-fences