【发布时间】:2016-04-20 14:28:26
【问题描述】:
我希望我可以尽可能清楚地理解。我正在维护有关舞台移动的数据,即当有人进入舞台和何时离开时。我希望 bigquery 表对每个阶段的移动都有一个条目(由于我将对数据进行的查询类型),但是输入和输出有两个更新,所以这就是我正在做的;
- 当有人进入舞台时正常流式插入
-
搬出时:
一个。使用类似的查询将截断的表复制到相同的目的地
SELECT * FROM my_dataset.my_table WHERE id !="id"b.为新行进行流式插入。
问题是,在复制操作后进行流式插入时会出现随机数据丢失。
我找到了这个链接:After recreating BigQuery table streaming inserts are not working?
已经提到,在这种情况下,在进行流式插入之前应该有 >2 分钟的延迟以避免数据丢失,但是我希望它是瞬时的,因为多个阶段的移动可以在几秒钟内发生.有解决方法或解决方法吗?或者我是否必须重新考虑我的完整流程,现在看起来不太可能?
【问题讨论】: