【问题标题】:SQL order of execution for correlated subquery相关子查询的 SQL 执行顺序
【发布时间】:2018-01-17 22:58:56
【问题描述】:

我有以下人事表

+---------+----------+-------------+
| name    | dept_nbr | job_title   |
+---------+----------+-------------+
| Michael | 14       | Programmer  |
| Kumar   | 14       | Programmer  |
| Dave    | 14       | Programmer  |
| Jane    | 14       | Manager     |
| Carol   | 37       | Programmer  |
| Joe     | 37       | Programmer  |
| John    | 59       | CEO         |
+---------+----------+-------------+

问题:找出所有少于 3 名程序员的 dept_nbr(部门)。

工作查询:

SELECT DISTINCT dept_nbr
  FROM Personnel AS P1
 WHERE (SELECT COUNT(P2.dept_nbr)
          FROM Personnel AS P2
         WHERE P1.dept_nbr = P2.dept_nbr AND P2.job_title = 'Programmer') < 3;

结果:

37
59

注意事项:

正确地不包括第 14 部门,因为它有 3 名程序员(3 名等于但不少于 3 名)。部门 59 的程序员为零,也正确包含在结果中。

我的问题:

当上述查询执行时,通用 SQL 引擎如何进行?根据我的阅读,SQL 执行顺序(大致)是:From、Where、Group By、Have 和 Select。那么,下面的说法正确吗?

1 - 外部查询将 Personnel 表的每一行作为 P1 传递给内部查询。

2.a - 内部查询将整个 Personnel 表作为 P2 逐行扫描,查找满足条件“P1.dept_nbr = P2.dept_nbr AND P2.job_title = '程序员”。

2.b –一旦对整个表进行内部查询,它会计算匹配的 dept_nbr 值并将其返回给外部查询。

3 – 在Outer Query中,如果Inner Query返回的计数满足条件“WHERE(Inner Query Count Result)

4 – 在外部查询处理的所有行之后,外部查询对结果执行 DISTINCT 并显示唯一的 dept_nbr 值。

我上面的理解正确吗?具体来说,外部查询是否在最后执行 DISTINCT(步骤 #4)?这样看来,内部查询是在做冗余扫描(例如,它处理了四次dept_nbr = 14,当它在第一遍中确实有答案时)。

我在 sqlfiddle.com 上使用 MySQL 5.6 测试了上述查询。

【问题讨论】:

    标签: mysql sql subquery correlated-subquery


    【解决方案1】:

    在您的查询之前添加EXPLAIN(或EXPLAIN EXTENDED),它应该为您提供解释计划,该计划将按照您的查询顺序准确详细说明步骤。在尝试优化查询时,这是一个非常有用的工具。

    【讨论】:

      【解决方案2】:

      当上述查询执行时,通用 SQL 引擎如何进行? 根据我的阅读,SQL 执行顺序(大致)是:From,Where, 分组依据、拥有和选择。

      这种说法——通常——不正确。 SQL 按您描述的顺序解析。但是,执行是由优化器决定的,可能与原始查询几乎没有关系。请记住:SQL 是一种描述性语言,而不是一种过程语言。它描述了结果集,而不是计算它的具体步骤。

      也就是说,MySQL 的执行计划比大多数其他数据库(尤其是具有更好优化器的更高级的数据库)更接近查询。而且,几乎所有数据库都将按照您为此查询描述的步骤进行。子查询中的聚合限制了优化的选择。

      如果要消除冗余,请在过滤之前执行select distinct

      SELECT dept_nbr
      FROM (SELECT DISTINCT dept_nbr FROM Personnel P1) P1
      WHERE (SELECT COUNT(P2.dept_nbr)
             FROM Personnel AS P2
             WHERE P1.dept_nbr = P2.dept_nbr AND P2.job_title = 'Programmer'
            ) < 3;
      

      您也可以通过聚合更简单地做到这一点:

      select dept_nbr
      from personnel
      group by dept_nbr
      having sum(job_title = 'Programmer') < 3;
      

      【讨论】:

      • 感谢您提供宝贵而详细的答案。我已经测试了您的查询,两者都有效。我不知道“有总和”构造的可能性。再次感谢。
      • 事实上,我看到你的书中提到了“HAVING SUM”,第一次参考第 1 页。 88! imgur.com/a/eZBtg 非常酷。 :)
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2011-01-16
      • 1970-01-01
      • 2017-05-03
      • 1970-01-01
      • 2014-07-30
      • 1970-01-01
      • 2023-03-13
      相关资源
      最近更新 更多