【发布时间】:2020-05-16 09:37:54
【问题描述】:
我目前正在使用 Airflow PostgresToGoogleCloudStorageOperator 和 GoogleCloudStorageToBigQueryOperator 将我的 Postgres DB(托管在 AWS RDS 上)的每个表导出到 BigQuery。它可以工作,但我有 75 个表,所以 Airflow 创建了 75 * 2 个工作。由于我是 Airflow 的新手,我不知道这是否是一个好习惯。
无论如何,我想找到一种方法将所有表一次(pg_dump?)导出到 GCS,然后将它们导入 BigQuery。
【问题讨论】:
标签: postgresql google-bigquery google-cloud-storage airflow google-cloud-composer