【发布时间】:2020-08-24 16:41:57
【问题描述】:
我有一个要求,我想每隔一个星期五安排一次气流作业。但是,问题是我无法弄清楚如何为此编写时间表。
我不想为此有多个工作。
我试过了
'0 0 1-7,15-21 * 5
但是它不起作用,它每天从 1 点到 7 点和 15 点到 21 点运行。
从shubham 的回答中,我意识到我们可以拥有一个可以为我们跳过任务的PythonOperator。我试图实施解决方案。不过好像没用。
因为在 2 周内进行测试太难了。这就是我所做的。
- 我安排 DAG 每 5 分钟运行一次
- 但是,我正在编写 python 运算符跳过备用任务(与我正在尝试做的非常相似,交替星期五)。
DAG:
args = {
'owner': 'Gaurang Shah',
'retries': 0,
'start_date':airflow.utils.dates.days_ago(1),
}
dag = DAG(
dag_id='test_dag',
default_args=args,
catchup=False,
schedule_interval='*/5 * * * *',
max_active_runs=1
)
dummy_op = DummyOperator(task_id='dummy', dag=dag)
def _check_date(execution_date, **context):
min_date = datetime.now() - relativedelta(minutes=10)
print(context)
print(context.get("prev_execution_date"))
print(execution_date)
print(datetime.now())
print(min_date)
if execution_date > min_date:
raise AirflowSkipException(f"No data available on this execution_date ({execution_date}).")
check_date = PythonOperator(
task_id="check_if_min_date",
python_callable=_check_date,
provide_context=True,
dag=dag,
)
【问题讨论】: