【发布时间】:2021-04-26 20:51:47
【问题描述】:
我有一个 Airflow 2.0 DAG,过去用 start_date、catchup = True 和 max_active_runs = 5 定义。目标是处理从 start_date 开始的数据,最多并行执行五个 DAG 运行。
某些任务是用 depends_on_past = True 定义的,但是我观察到它们有时确实会并行执行,而且似乎 depends_on_past 不受尊重。
这是为什么?是否可以通过 catchup 或 backfill 并行 DAG 运行处理历史数据,并防止 DAG 中的某些任务并行执行?
【问题讨论】: