本篇文章主要“简解”MySQL数据库的体系架构。

从纵向的角度来看,MySQL可以看成是两层架构,第一层我们通常称之为SQL层(SQL Layer),第二层称之为存储引擎层(Storage Engine Layer)。其最为抽象的架构示意图如下:

mysql-2016-12-14-1

所有通过SQL对数据库进行的操作,首先都要通过SQL Layer层做处理。它所做的主要工作有Query优化、Query Cache、Query解析、权限管理等等。

存储引擎层,主要负责MySQL底层的数据存取。其主要由MySQL的各个存储引擎组成,例如我们最为常见的有MyISAM、InnoDB、MEMORY、MERGE、ARCHIVE等。

单从上图来看,MySQL的架构似乎非常简单,只有两层。简单,只是因为咱们画的简单,在实际的MySQL架构中,每一层的内部都包含众多小的模块,尤其是SQL Layer层,结构尤其复杂。下面,苦李分别对各层做一个简单介绍。

一、SQL Layer层

该层中能够数的上来的模块就有17个,依次为:

1、初始化模块

顾名思义,初始化模块就是在MySQL Server启动的时候,对整个系统做各种各样的初始化操作,比如各种buffer、cache结构的初始化和内存空间的申请,各种系统变量的初始化设定,各种存储引擎的初始化设置,等等。

2、核心API

核心API模块主要是提供一些需要非常高效的底层操作功能的优化实现,包括各种底层数据结构的实现,特殊算法的实现,字符串处理,数字处理,小文件I/O,格式化输出,以及最重要的内存管理部分。核心API模块的所有源代码都集中在mysys和strings文件夹下面,有兴趣的读者可以进行研究。

3、网络交互模块

底层网络交互模块抽象出底层网络交互所使用的接口api,实现底层网络数据的接收与发送,以方便其他各个模块调用,以及对这一部分的维护。所有源码都在vio文件夹下面。

4、客户端/服务端(C/S)交互模块

任何C/S结构的软件系统,都肯定会有自己独有的信息交互协议,MySQL也不例外。MySQL的Client & Server交互协议模块部分,实现了客户端与MySQL交互过程中的所有协议。当然这些协议都是建立在现有的OS和网络协议之上的,如TCP/IP及Unix Socket。

5、用户模块

用户模块的主要功能包括用户连接的权限控制、授权管理等。该模块是整个MySQL系统的“门岗”。

6、访问控制模块

造访客人进门了就可以想干嘛就干嘛么?为了安全考虑,肯定不能如此随意。这时候就需要访问控制模块实时监控客人的每一个动作,给不同的客人以不同的权限。访问控制模块实现的功能就是根据用户模块中各用户的授权信息,以及数据库自身特有的各种约束,来控制用户对数据的访问。用户模块和访问控制模块两者结合起来,组成了MySQL整个数据库系统的权限安全管理功能。

7、连接管理、连接线程和线程管理

连接管理模块负责监听对MySQL Server的各种请求,接收连接请求,转发所有连接请求到线程管理模块。每一个连接上MySQL Server的客户端请求都会被分配(或创建)一个连接线程为其单独服务。而连接线程的主要工作就是负责MySQLServer与客户端的通信,接受客户端的命令请求,传递Server端的结果信息等。线程管理模块则负责管理维护这些连接线程,包括线程的创建,线程的缓存(cache)等。

8、Query解析和转发模块

在MySQL中我们习惯将所有Client端发送给Server端的命令都称为Query,在MySQLServer里,连接线程接收到客户端的一个Query后,会直接将该Query传递给专门负责将各种Query进行分类,然后转发给各个对应的处理模块,这个模块就是Query解析和转发模块。其主要工作就是将Query语句进行语义和语法的分析,然后按照不同的操作类型进行分类,接着做出针对性的转发。

9、Query Cache模块

Query Cache模块在MySQL中是一个非常重要的模块,它的主要功能是将客户端提交给MySQL的Select类Query请求的返回结果集缓存(cache)到内存中,与该Query的一个hash值做一个对应。在该Query所取数据的基表发生任何数据的变化之后,MySQL会自动使该Query的缓存失效。在读写比例非常高的应用系统中,QueryCache对性能的提高是非常显著的。当然它对内存的消耗也是非常大的。

10、查询优化器

查询优化器,顾名思义,就是优化客户端请求的查询语句,根据客户端请求的查询语句和数据库中的一些统计信息,在一系列算法的基础上进行分析,得出一个最优的策略,告诉后面的程序如何取得这个查询语句的结果。

11、表变更管理模块

表变更管理模块主要是负责完成一些DML和DDL的操作,如:update、delte、insert、cre-ate table、alter table等语句的处理。

12、表维护模块

表的状态检查,错误修复,以及优化和分析等工作都是表维护模块须要做的事情。

13、系统状态管理模块

系统状态管理模块负责在客户端请求系统状态的时候,将各种状态数据返回给用户,像DBA常用的各种show status命令、show variables命令等,其所得到的结果都是由这个模块返回的。

14、表管理器

这个模块从名字上看很容易和上面的表变更和表维护模块相混淆,但是其功能与变更及维护模块其实完全不同。大家知道,每一个MySQL的表都有一个表的定义文件,也就是*.frm文件。表管理器的工作主要就是维护这些文件,以及一个cache,该cache中的主要内容是各个表的结构信息。此外它还维护table级别的锁管理。

15、日志记录模块

日志记录模块主要负责整个系统级别的逻辑层的日志的记录,包括error log、binary log、slowquery log等。

16、复制模块

复制模块又可分为Master模块和Slave模块两部分,Master模块主要负责在Replication环境中读取Master端的binary日志,以及与Slave端的I/O线程交互等工作。Slave模块比Master模块所要做的事情稍多一些,在系统中主要体现在两个线程上面。一个是负责从Master请求和接受binary日志,并写入本地relay log中的I/O线程。另外一个是负责从relay log中读取相关日志事件,然后将其解析成可以在Slave端正确执行并得到和Master端完全相同结果的命令,再交给Slave执行的SQL线程。

17、存储引擎接口

存储引擎接口模块可以说是MySQL数据库中最有特色的了。目前各种数据库产品中,基本上只有MySQL可以实现其底层数据存储引擎的插件式管理。这个模块实际上只是一个抽象类,但正是因为它成功地将各种数据处理高度抽象化,才成就了今天MySQL可插拔存储引擎的特色。

二、存储引擎层

正如上述17点所说,MySQL中插件式存储引擎架构一直是其非常有特色的亮点,其灵活的处理方式,高度可定制化及完全开放的实现一直被很多高级用户所肯定。

有关存储引擎层中,常见存储引擎的特点及应用场景,在本篇文章中不再做展开。考虑到每个存储引擎拿出来都能单独写上一篇文章,后续再做详细说明吧。

程序员日常

今天是跟女朋友在一起两周年,一场约会、一顿两人晚餐、一起美丽的回忆。

程序员的幸福,真的很简单。

哦,已经过了0点,应该是昨天了。

扫码关注李苦李公众号

李苦李公众号

标签: 存储, 架构, 数据库