【发布时间】:2018-05-25 02:10:30
【问题描述】:
在我的 python 项目中,我需要用一个关系数据框填充一个 bigquery 表。我在从头开始创建一个新表并确保我上传到它的第一个数据实际上被放入表中时遇到了很多麻烦。
我已阅读页面https://cloud.google.com/bigquery/streaming-data-into-bigquery#dataconsistency 并看到将 insertId 应用于插入查询可以解决问题,但由于我使用 pandas 的数据帧,pandas-gbq 包的函数 to_gbq 似乎非常适合这个任务。然而,当使用 to_gbq 函数并创建/替换新表时,有时(显然是随机的)第一个数据块不会写入表中。
有人知道如何确保将 DataFrame 完全插入到 bigquery 新创建的表中吗?谢谢
【问题讨论】:
标签: python pandas dataframe google-bigquery google-cloud-platform