【发布时间】:2021-12-28 13:04:25
【问题描述】:
我有一些数据集(27 个 CSV 文件,用分号分隔,总计 150+GB)每周都会上传到我的 Cloud Storage 存储桶。
目前,我使用 BigQuery 控制台手动组织数据,声明变量并更改文件名 27 次。第一个文件替换整个先前的数据库,然后将其他 26 个附加到它。文件名始终相同。
我怎样才能使用 Python 做到这一点?
【问题讨论】:
-
您是否考虑过 Workflow 来实现这一目标?
-
没有。我什至不知道它的存在! (我感到羞耻)
标签: python google-bigquery google-cloud-storage