【发布时间】:2016-09-30 05:19:15
【问题描述】:
我有一个包含近一百万行的表。在其中搜索单个值需要 5 秒,在 15 秒内搜索大约 500 个值。这是相当长的一段时间。请告诉我如何优化查询?
我的查询是:
select a,b,c,d from table where a in ('a1','a2')
工作 ID:stable-apogee-119006:job_ClLDIUSdDLYA6tC2jfC5GxBXmv0
【问题讨论】:
-
为什么它被否决了?关于如何优化的任何答案?
-
请阅读:stackoverflow.com/help/mcve。通过提供您尝试运行的查询来帮助他人帮助您。对于 BigQuery 工程师,拥有一些过去查询的作业 ID 也可能会有所帮助。
-
感谢您添加作业 ID。除非有人抢先我,否则我明天早上(太平洋时间)去看看。
-
您在查询中使用了什么 billingTier?您使用的是旧版 SQL 还是标准 SQL?你的表分区了吗? Bigquery 是用于 TB 级规模的大数据工具,所以不要指望小于 3 秒的答案,即使是小数据也不会有。但对于海量数据,它会非常快。
-
旧版 sql。根据时间或任何其他字段进行表分区?不,我们只有 1 个 10 lac 行的表。
标签: database search google-bigquery