【问题标题】:BigQuery and GROUP BY clauseBigQuery 和 GROUP BY 子句
【发布时间】:2014-01-16 06:30:40
【问题描述】:

我试图弄清楚 Google BigQuery 在聚合和分组方面的工作原理。我阅读了文档,上面写着 GROUP BY:

GROUP BY 子句允许您对具有相同值的行进行分组 对于给定的字段。然后,您可以对每个执行聚合函数 团体。分组发生在任何选择或聚合之后 SELECT 子句。

所以它说在分组后我可以执行聚合函数(我假设这是像 COUNT 这样的函数)。但比后面的句子说分组发生在 SELECT 子句中的任何选择或聚合之后。

如果我有

SELECT f1, COUNT(f2)
  FROM ds.Table
  GROUP BY f1;

先发生哪个,分组还是计数?

【问题讨论】:

  • 试图理解问题的目标:如果是一个或另一个会有什么不同?
  • @fh 关键是要了解大查询的工作原理......我实际上不知道如果它在 group by 之前进行聚合,它是如何工作的......但这就是它在文档中所说的。所以我希望有人能解释一下。而且因为您是 Google 开发者关系团队的一员,所以您似乎是这个问题的完美人选:)
  • 我明白你的意思。当我们在内部查看文档时,请放心,BigQuery 在这种情况下会做它唯一能做的事情。感谢您的反馈!
  • 我不确定您是否真的想知道 BQ 是如何工作的,或者只是指出文档中的奇怪解释。在第一种情况下,据我所知,BQ 是基于 Dremel 的,你可以试试这个:link

标签: google-bigquery


【解决方案1】:

您将拥有组,然后是计数。在您的情况下,您会为每个 f1 获得一行,然后是计数。

但是,如果你想做一些有趣的事情,你可以使用窗口函数,首先你可以按一些字段分组,然后你可以对结果行执行函数,这非常方便。

查看 bigquery 在线文档的窗口函数部分,了解一些相关示例。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-10-21
    • 1970-01-01
    • 1970-01-01
    • 2022-12-14
    • 2012-04-20
    • 1970-01-01
    相关资源
    最近更新 更多