【发布时间】:2018-07-18 04:41:34
【问题描述】:
我们每天将大约一百万条记录流式传输到 BQ,并且特定字符串列具有“高”、“中”和“低”的分类值。
我想了解 Biq Query 是否会在其自身端进行压缩以外的存储优化,其规模如何?查找有关此的文档,但无法找到相同的解释。
例如,如果我有:
**Col1**
High
High
Medium
Low
High
Low
**... 100 Million Rows**
BQ 会按如下方式在内部存储它
**Col1**
1
1
2
3
1
3
**... 100 Million Rows**
【问题讨论】:
-
如果您不赞成投票,我们将不胜感激,谢谢。
-
投反对票的不是我,但你看到blog post on Capacitor了吗?
-
我认为,需要注意的是:无论数据如何压缩、存储——用户仍然按照原始数据大小(未压缩)计费!
标签: optimization google-bigquery query-optimization storage