第10课 分组数据
- 这一课介绍如何分组数据,以便汇总表内容的子集。这涉及两个新
SELECT语句子句,GROUP BY子句和HAVING子句。 - 讲授了如何使用
GROUP BY子句对多组数据进行汇总计算,返回每个组的结果。 - 我们看到了如何使用
HAVING子句过滤特定的组,还知道了ORDER BY和GROUP BY之间以及WHERE和HAVING之间的差异。
10.1 数据分组
使用分组可以将数据分为多个逻辑组,对每个组进行聚集计算。
10.2 创建分组
分组是使用SELECT语句的GROUP BY子句建立的。
-
GROUP BY子句可以包含任意数目的列,因而可以对分组进行嵌套,更细致地进行数据分组。 -
如果在
GROUP BY子句中嵌套了分组,数据将在最后指定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(所以不能从个别的列取回数据)。 -
GROUP BY子句中列出的每一列都必须是检索列或有效的表达式(但不能是聚集函数)。如果在SELECT中使用表达式,则必须在GROUP BY子句中指定相同的表达式。不能使用别名。 -
大多数
SQL实现不允许GROUP BY列带有长度可变的数据类型(如文本或备注型字段)。 -
除聚集计算语句外,
SELECT语句中的每一列都必须在GROUP BY子句中给出。 -
如果分组列中包含具有
NULL值的行,则NULL将作为一个分组返回。如果列中有多行NULL值,它们将分为一组。 -
GROUP BY子句必须出现在WHERE子句之后,ORDER BY子句之前。
提示:
ALL子句
Microsoft SQL Server等有些SQL实现在GROUP BY中支持可选的ALL子句。这个子句可用来返回所有分组,即使是没有匹配行的分组也返回(在此情况下,聚集将返回NULL)。具体的DBMS是否支持ALL,请参阅相应的文档。注意:通过相对位置指定列
有的
SQL实现允许根据SELECT列表中的位置指定GROUP BY的列。例如,GROUP BY 2, 1可表示按选择的第二个列分组,然后再按第一个列分组。虽然这种速记语法很方便,但并非所有SQL实现都支持,并且使用它容易在编辑SQL语句时出错。
10.3 过滤分组
说明:使用
HAVING和WHERE
HAVING与WHERE非常类似,如果不指定GROUP BY,则大多数DBMS会同等对待它们。不过,你自己要能区分这一点。使用HAVING时应该结合GROUP BY子句,而WHERE子句用于标准的行级过滤。说明:
HAVING和WHERE的差别这里有另一种理解方法,
WHERE在数据分组前进行过滤,HAVING在数据分组后进行过滤。这是一个重要的区别,WHERE排除的行不包括在分组中。这可能会改变计算值,从而影响HAVING子句中基于这些值过滤掉的分组。
10.4 分组和排序
提示:不要忘记
ORDER BY一般在使用
GROUP BY子句时,应该也给出ORDER BY子句。这是保证数据正确排序的唯一方法。千万不要仅依赖GROUP BY排序数据。说明:
Access的不兼容性
Microsoft Access不允许按别名排序,因此这个例子在Access中将失败。解决方法是用实际的计算或字段位置替换items(在ORDER BY子句中),即ORDER BY COUNT(*), order_num或ORDER BY 2, order_num。