【发布时间】:2016-05-24 10:15:08
【问题描述】:
我正在使用 BigQuery,有一个非常大的表,其中包含 month TIMESTAMP 字段:
code STRING
org STRING
month TIMESTAMP
我不小心将一个月的数据写入了两次,导入两次,然后错误地使用了追加模式。
鉴于 BigQuery 不允许我更新或删除数据,删除重复数据的最佳方法是什么?
我首先将除问题月份之外的所有数据复制到一个临时表中:
SELECT * FROM mytable WHERE month!=TIMESTAMP('2012-01-01')
现在我最想做的是将2012-01-01 的数据一个 复制到同一个临时表中,删除每个重复的行。这在 SQL 中可行吗?
如果不是,我想我可以将2012-01-01 的数据直接重新导入到临时表中,但如果可能的话,我宁愿避免这种情况。
无论哪种方式,我都会将数据的干净副本复制到临时表中,然后将其重新导入到永久表中。
【问题讨论】:
标签: sql google-bigquery