文章转自http://www.ttlsa.com/mysql/mysql-sql-performance-let-you-head-big-open/

今天看了一篇文章,讲述了使用in在某些情况下的缺陷,然后作者通过union生成临时表解决了这个问题,感觉这个优化特别好,和大家分享一下

由于分库分表的原因,和开发规定了不能使用 表表JOIN 语句。因此,我们要将 JOIN 语句的转化成使用 IN 来做。如现在有 表 A(a_id, c_a)c_a有普通索引,表 B(b_id, c_a) 这两个表要关联, 应该转化为以下步骤处理:

  • 先查询B中的 a_id

 

 
1
;

 

  • 使用 IN 查询 A 表

 

 
1
)

 

场景

现在表的数据量有 800万。

一般的使用语句是:

 
1
;

上面语句会执行的很快,知道使用 explain 的都明白这样一般都是会使用索引的,并且是所有范围扫描。

MySQL不会从 1 开始 扫描 800万,而是从555555 扫描到 555559(只要扫描5行数据)。

在一般情况下是没有什么问题的。但是如果 IN 里面的数据是不连续的就有很大问题了

创建表结构语句

 

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
(
,
,
,
,
,
,
,
,
,
)
;
 
(
,
,
,
,
,
,
,
)
;
 
重复执行
t
,
,
,
,
,
,
,
c6
;

 

下面是具体的实验过程

  • 使用IN查询连续的数

 

 
1
2
3
4
5
6
7
8
9
10
11
12
13
SELECT *
t
;
-
                              
-
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
.
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
-
)

 

  • 使用IN查询不连续的数

 

 
1
2
3
4
5
6
7
8
9
10
11
12
13
SELECT *
t
;
-
                              
-
aaaaaaaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaaaaaaa
.
aaaaaaaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaaaaaaa
--
)

 

  • 使用UNION优化

 

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
SELECT *
(
ALL
ALL
ALL
ALL
955559
t
;
-
                              
-
aaaaaaaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaaaaaaa
.
aaaaaaaaaaaaaaaaaaaaaaaaa
aaaaaaaaaaaaaaaaaaaaaaaaa
--
)

从上面可以看出上面使用UNION的方法生成一个临时表作为关联的主表

拓展

要是MySQL有只带的一个行转列的函数那就完美了。这样我们就可以不用使用UNION了。

 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
;
+
|
+
|
+
)
    
变成以下
;
+
|
+
|
|
|
|
|
+

要是能像上面就太棒了简直。

相关文章:

  • 2021-07-08
  • 2022-12-23
  • 2021-12-14
  • 2022-12-23
  • 2021-05-31
  • 2022-03-03
  • 2022-12-23
  • 2021-08-03
猜你喜欢
  • 2022-12-23
  • 2021-11-07
  • 2022-12-23
  • 2021-05-21
  • 2021-08-21
  • 2022-03-08
相关资源
相似解决方案