【发布时间】:2021-04-01 18:09:28
【问题描述】:
我正在考虑从远程服务器将 CSV 加载到 Big Query 中,即使经过压缩,它们也会大于 10MB。我的理解是,要将远程文件直接加载到 Big Query 中,这在技术上将遵循在数据所在的远程服务器上的脚本中实现的“从本地文件加载数据”的过程。
根据大查询文档,这限制为 10MB/文件。我是否需要将文件加载到 GCS 中,然后使用 BQ 数据传输服务来执行此任务?将巨大的 CSV 分解成一堆 10MB 的 CSV 是一个实用的选择吗?这需要可扩展。
【问题讨论】:
-
10 MB 限制适用于使用 Google Cloud Console GUI 加载文件。相反,请使用 CLI
bq load而不是尝试拆分文件。
标签: google-cloud-platform google-bigquery google-cloud-storage