【发布时间】:2014-01-16 06:30:40
【问题描述】:
我试图弄清楚 Google BigQuery 在聚合和分组方面的工作原理。我阅读了文档,上面写着 GROUP BY:
GROUP BY 子句允许您对具有相同值的行进行分组 对于给定的字段。然后,您可以对每个执行聚合函数 团体。分组发生在任何选择或聚合之后 SELECT 子句。
所以它说在分组后我可以执行聚合函数(我假设这是像 COUNT 这样的函数)。但比后面的句子说分组发生在 SELECT 子句中的任何选择或聚合之后。
如果我有
SELECT f1, COUNT(f2)
FROM ds.Table
GROUP BY f1;
先发生哪个,分组还是计数?
【问题讨论】:
-
试图理解问题的目标:如果是一个或另一个会有什么不同?
-
@fh 关键是要了解大查询的工作原理......我实际上不知道如果它在 group by 之前进行聚合,它是如何工作的......但这就是它在文档中所说的。所以我希望有人能解释一下。而且因为您是 Google 开发者关系团队的一员,所以您似乎是这个问题的完美人选:)
-
我明白你的意思。当我们在内部查看文档时,请放心,BigQuery 在这种情况下会做它唯一能做的事情。感谢您的反馈!
-
我不确定您是否真的想知道 BQ 是如何工作的,或者只是指出文档中的奇怪解释。在第一种情况下,据我所知,BQ 是基于 Dremel 的,你可以试试这个:link
标签: google-bigquery