【发布时间】:2021-08-04 09:04:17
【问题描述】:
我正在尝试将一些数据从我的应用程序传输到 Big Query,以便我可以在其上运行 SQL 查询。以下是我正在采取的步骤,并想知道是否有工具可以自动执行此过程。
-
从终端手动下载应用程序数据,格式为 JSON。
-
运行 python 脚本将此文件解析为可读的 JSON 并进行修改(例如,将空格替换为下划线等,以便能够上传到 Google Cloud Storage (GCS)。
-
手动将此更新后的文件上传到 GCS。
-
使用来自 GCS 的这些数据,使用架构在 Big Query 中手动生成数据集和表。
有没有办法使用云工具自动化整个过程?我查看了谷歌数据流,但它似乎不是这个工具。或者我应该只拥有一个可以完成上述所有操作的 python 程序?
请指教。
【问题讨论】:
-
你的文件有多大?你从哪里下载你的文件?来自公共互联网?
-
此时文件的大小非常小,仍在测试中。数据库目前最多只有大约 1000 行。它是从移动应用程序下载的。
标签: python google-bigquery google-cloud-storage google-cloud-dataflow