【发布时间】:2019-07-10 12:24:50
【问题描述】:
如果有人回答我并向我解释这件事,我将不胜感激。
据我了解,DAG 是如何完成工作的物理计划,但我不明白它是如何真正并行执行任务的。 我详细阐述了我的问题,希望能得到答案。
1) 任务如何划分阶段? (低级口语)
2) 提供大量的执行者,一个阶段的任务是否同时工作?
如果是这样,这是否意味着并行运行的任务数等于**独立阶段中的任务数**?
3) 最后,这些阶段何时并行工作?如何从 DAG 中知道并行执行阶段的数量?
【问题讨论】:
标签: apache-spark