关于 SQL/Postgres 中聚合函数内部的问题答案

【问题标题】：question about aggregate function internals in SQL/Postgres关于 SQL/Postgres 中聚合函数内部的问题
【发布时间】：2011-03-23 23:33:08
【问题描述】：

像 SUM 这样的函数是如何工作的？如果我执行

select id,sum(a) from mytable group by id

它是否按 id 排序，然后对每个相等的 id 范围求和？我不是规划专家，但看起来就是这样，mytable 可能是一亿行，有几百万个不同的 id。

或者它只是保留一个 id -> current_sum 的散列，然后在每一行增加 id 的值或添加一个新键？这不是更快，更省内存吗？

【问题讨论】：

【解决方案1】：

SQL 标准试图规定外部行为，而不是内部行为。在这种特殊情况下，符合（众多）标准之一的 SQL 实现应该像按此顺序执行操作一样行事。

遵循 SQL 标准的查询优化器可以随意重新排列事物，只要结果与遵循这些步骤时的结果相同。

您可以在this SO question的答案和cmets中找到更多详细信息。

【讨论】：

【解决方案2】：

【讨论】：