【发布时间】:2019-07-19 09:16:48
【问题描述】:
我正在使用 Airflow 来编排各种批处理和转换过程。在编写新流程时,我遇到了需要将 BigQuery 表转换为另一个表的场景。我有两种方法可以实现:
- 通过使用bigQuery_to_bigquery 运算符
- 通过编写自己的容器来执行任务,然后使用 Docker 或 Kubernetes 操作符来调用它
使用第一种方法,我的任务将得到缓解,我不需要维护/修复任何错误。但是,我会将编排和转换结合在一起。使用第二种方法,编排将与转换分开,但我必须维护 BigQuery API 和连接。
看起来这两种方法都有各自的优点和缺点。有什么推荐的方法吗?
【问题讨论】:
标签: python google-bigquery airflow google-cloud-composer