【发布时间】:2016-12-09 15:55:55
【问题描述】:
假设您有一个气流 DAG,回填没有意义,这意味着,在它运行一次之后,再快速运行它之后的时间将完全没有意义。
例如,如果您从某个仅每小时更新一次的来源将数据加载到数据库中,那么快速连续发生的回填只会一次又一次地导入相同的数据。
当您实例化一个新的每小时任务时,这尤其令人讨厌,并且在它开始按您指定的时间间隔运行之前,它错过了每小时运行 N 次,做多余的工作。
我能想到的唯一解决方案是他们在FAQ of the docs 中特别建议反对的东西
我们建议不要将动态值用作 start_date,尤其是
datetime.now(),因为它可能会造成混淆。
有什么方法可以禁用 DAG 的回填,或者我应该执行上述操作吗?
【问题讨论】:
标签: python scheduled-tasks airflow