【发布时间】:2018-08-06 13:23:17
【问题描述】:
当我有潜在的重复行时,我应该如何每天在 BigQuery 中导入数据?
这里有一点上下文。我每天都会将数据从电子表格更新到 BigQuery。我正在使用带有简单 WRITE_APPEND 方法的 Google App Script。
有时我会导入前一天已经导入的数据。所以我想知道如何避免这种情况?
我可以构建一个 sql 查询以便每天从重复行中清除我的表吗?或者这是否可以在导入它们之前检测到重复(例如在我的作业定义中使用一些特定命令......)?
谢谢!
【问题讨论】:
-
您是否有唯一的列,例如 ID 或插入时间戳?您也许可以找到过去有关删除重复项的答案。
标签: google-bigquery