mysql的逻辑架构

mysql架构与历史

最上层的服务并不是mysql独有的,大多数基于网络的客户端/服务端的工具或者服务都有类似的架构。比如连接处理、授权认证、安全等等
第二层架构是mysql比较有意思的部分,大多数mysql的核心功能都在这一层实现。其中分析器、优化器、执行器统称为解析器。所有的内置函数、跨储存引擎的功能都在这一层实现
第三层包含了存储引擎。在mysql中负责存储和提取。存储引擎不会去解析sql,不同存储引擎之间不会互相通信,只是单纯的响应上层服务器的请求

连接管理与安全性

每个客户端连接都会在服务器进程中有一个线程,这个连接的查询只会在这个单独的线程中进行。该线程只能轮流在某个CPU核心或者CPU中运行,服务器会负责缓存线程,因此不需要为每一个新建的连接创建或者销毁线程。
(mysql5.5或者更新的版本中提供了一个api,支持线程池插件,可以使用池中的线程来服务大量的连接

当客户端连接到mysql服务器时,服务器会对其进行验证。认证基于用户名、原始主机信息和密码。如果使用了安全套接字(SSL)方式连接,还可以使用x.509证书认证。一旦客户端连接成功,服务器会继续验证该客户端是否具有某个特定查询的权限。

优化与执行

mysql会解析查询,并创建内部数据结构(解析树),然后对其进行优化,包括重写查询、决定表的读取顺序,以及选择合适的索引等。用户可以通过特殊的关键词提提示(hint)优化器,影响它的决策过程。也可以请求优化器解释(explain)优化过程的各个因素,使用户可以知道服务器是如何进行优化决策的,并提供一个参考基准,便于用户重构查询和schema、修改相关配置,使应用尽可能高效运行。

优化器并不关系表使用的是什么存储引擎,但存储引擎对于优化查询是有影响的。优化器会请求存储引擎提供容量或某个具体操作的开销信息,以及表的统计数据等。例如,某些存储引擎的某种索引,可能对一些特定的查询有优化。

对于select语句,在解析查询之前,服务器会先检查查询缓存(Query Cache),如果能够在其中找到对应的查询,服务器就不必再执行查询解析、优化和执行整个过程,而是直接返回查询缓存中的结果集。
加上SQL NoCache去跑SQL,这样跑出来的时间就是真实的查询时间了。

参考资料:《高性能MySQL》

相关文章: