任务和部分之间的区别在于代码执行的时间范围。部分包含在 sections 构造中,并且(除非指定了 nowait 子句)线程不会离开它,直到所有部分都已执行:
[ sections ]
Thread 0: -------< section 1 >---->*------
Thread 1: -------< section 2 >*------
Thread 2: ------------------------>*------
... *
Thread N-1: ---------------------->*------
这里N 线程遇到了一个sections 结构,其中包含两个部分,第二个部分比第一个部分花费更多时间。前两个线程各执行一个部分。其他N-2 线程只是在section 构造末尾的隐式屏障处等待(此处显示为*)。
任务尽可能在所谓的任务调度点排队和执行。在某些情况下,可以允许运行时在线程之间移动任务,即使在它们的生命周期中也是如此。这样的任务被称为 untied,一个 untied 任务可能开始在一个线程中执行,然后在某个调度点它可能被运行时迁移到另一个线程。
不过,任务和部分在许多方面还是相似的。例如,以下两个代码片段实现了基本相同的结果:
// sections
...
#pragma omp sections
{
#pragma omp section
foo();
#pragma omp section
bar();
}
...
// tasks
...
#pragma omp single nowait
{
#pragma omp task
foo();
#pragma omp task
bar();
}
#pragma omp taskwait
...
taskwait 的工作方式与barrier 非常相似,但对于任务 - 它确保当前执行流程将暂停,直到所有排队的任务都已执行。它是一个调度点,即它允许线程处理任务。需要single 构造,以便仅由一个线程创建任务。如果没有single 构造,每个任务将被创建num_threads 次,这可能不是人们想要的。 nowait 构造中的 nowait 子句指示其他线程不要等到执行 single 构造(即删除 single 构造末尾的隐式屏障)。于是他们立即点击taskwait 并开始处理任务。
taskwait 是一个明确的调度点,这里为了清楚起见。还有隐式调度点,尤其是在屏障同步内部,无论是显式的还是隐式的。因此,上面的代码也可以简单地写成:
// tasks
...
#pragma omp single
{
#pragma omp task
foo();
#pragma omp task
bar();
}
...
如果存在三个线程,以下是可能发生的一种情况:
+--+-->[ task queue ]--+
| | |
| | +-----------+
| | |
Thread 0: --< single >-| v |-----
Thread 1: -------->|< foo() >|-----
Thread 2: -------->|< bar() >|-----
在| ... | 内显示的是调度点的操作(taskwait 指令或隐式屏障)。基本上线程1 和2 暂停他们当时正在做的事情并开始处理队列中的任务。处理完所有任务后,线程将恢复其正常执行流程。请注意,线程1 和2 可能在线程0 退出single 构造之前到达调度点,因此左侧| 不需要对齐(这在上图中表示)。
线程1 也可能会在其他线程能够请求任务之前完成处理foo() 任务并请求另一个任务。所以foo() 和bar() 都可能被同一个线程执行:
+--+-->[ task queue ]--+
| | |
| | +------------+
| | |
Thread 0: --< single >-| v |---
Thread 1: --------->|< foo() >< bar() >|---
Thread 2: --------------------->| |---
如果线程 2 来得太晚,单挑出的线程也有可能执行第二个任务:
+--+-->[ task queue ]--+
| | |
| | +------------+
| | |
Thread 0: --< single >-| v < bar() >|---
Thread 1: --------->|< foo() > |---
Thread 2: ----------------->| |---
在某些情况下,编译器或 OpenMP 运行时甚至可能完全绕过任务队列并串行执行任务:
Thread 0: --< single: foo(); bar() >*---
Thread 1: ------------------------->*---
Thread 2: ------------------------->*---
如果区域代码中不存在任务调度点,则 OpenMP 运行时可能会在其认为合适的时候启动任务。例如,所有任务都可能被推迟到到达parallel 区域末尾的屏障。