Mysql 工作原理图

Mysql是由SQL接口,解析器,优化器,缓存,存储引擎组成的。

mysql原理图各个组件说明:

  1. connectors
    与其他编程语言中的sql 语句进行交互,如php、java等。
  2. Management Serveices & Utilities
    系统管理和控制工具
  3. Connection Pool (连接池)
    管理缓冲用户连接,线程处理等需要缓存的需求
  4. SQL Interface (SQL接口)接受用户的SQL命令,并且返回用户需要查询的结果。比如select from就是调用SQL Interface
  5. Parser (解析器)SQL命令传递到解析器的时候会被解析器验证和解析。
    主要功能:
    a . 将SQL语句分解成数据结构,并将这个结构传递到后续步骤,后面SQL语句的传递和处理就是基于这个结构的
    b. 如果在分解构成中遇到错误,那么就说明这个sql语句是不合理的,语句将不会继续执行下去
  6. Optimizer (查询优化器)
    SQL语句在查询之前会使用查询优化器对查询进行优化(产生多种执行计划,最终数据库会选择最优化的方案去执行,尽快返会结果) 他使用的是“选取-投影-联接”策略进行查询。
    用一个例子就可以理解: select uid,name from user where gender = 1;
    这个select 查询先根据where 语句进行选取,而不是先将表全部查询出来以后再进行gender过滤
    这个select查询先根据uid和name进行属性投影,而不是将属性全部取出以后再进行过滤将这两个查询条件联接起来生成最终查询结果.
  7. Cache和Buffer (查询缓存)
    如果查询缓存有命中的查询结果,查询语句就可以直接去查询缓存中取数据。
    这个缓存机制是由一系列小缓存组成的。比如表缓存,记录缓存,key缓存,权限缓存等
  8. Engine (存储引擎)
    存储引擎是MySql中具体的与文件打交道的子系统。也是Mysql最具有特色的一个地方。
    Mysql的存储引擎是插件式的。它根据MySql AB公司提供的文件访问层的一个抽象接口来定制一种文件访问机制(这种访问机制就叫存储引擎)

SQL 语句执行过程

数据库通常不会被直接使用,而是由其他编程语言通过SQL语句调用mysql,由mysql处理并返回执行结果。那么Mysql接受到SQL语句后,又是如何处理
首先程序的请求会通过mysql的connectors与其进行交互,请求到处后,会暂时存放在连接池(connection pool)中并由处理器(Management Serveices & Utilities)管理。当该请求从等待队列进入到处理队列,管理器会将该请求丢给SQL接口(SQL Interface)。SQL接口接收到请求后,它会将请求进行hash处理并与缓存中的结果进行对比,如果完全匹配则通过缓存直接返回处理结果;否则,需要完整的走一趟流程:
(1)由SQL接口丢给后面的解释器(Parser),解释器会判断SQL语句正确与否,若正确则将其转化为数据结构。
(2)解释器处理完,便来到后面的优化器(Optimizer),它会产生多种执行计划,最终数据库会选择最优化的方案去执行,尽快返会结果。
(3)确定最优执行计划后,SQL语句此时便可以交由存储引擎(Engine)处理,存储引擎将会到后端的存储设备中取得相应的数据,并原路返回给程序。

注意点

(1)如何缓存查询数据
存储引擎处理完数据,并将其返回给程序的同时,它还会将一份数据保留在缓存中,以便更快速的处理下一次相同的请求。具体情况是,mysql会将查询的语句、执行结果等进行hash,并保留在cache中,等待下次查询。
(2)buffer与cache的区别
从mysql原理图可以看到,缓存那里实际上有buffer和cache两个,那它们之间的区别:简单的说就是,buffer是写缓存,cache是读缓存。
(3)如何判断缓存中是否已缓存需要的数据
这里可能有一个误区,觉得处理SQL语句的时候,为了判断是否已缓存查询结果,会将整个流程走一遍,取得执行结果后再与需要的进行对比,看看是否命中,并以此说,既然不管缓存中有没有缓存到查询内容,都要整个流程走一遍,那缓存的优势在哪?
其实并不是这样,在第一次查询后,mysql便将查询语句以及查询结果进行hash处理并保留在缓存中,SQL查询到达之后,对其进行同样的hash处理后,将两个hash值进行对照,如果一样,则命中,从缓存中返回查询结果;否则,需要整个流程走一遍。

MySQL逻辑架构整体分为三层:

1.最上层是一些客户端和连接服务,包含本地sock通信和大多数基于客户端/服务端工具实现的类似于tcp/ip的通信。主要完成一些类似于连接处理、授权认证、及相关的安全方案。在该层上引入了线程池的概念,为通过认证安全接入的客户端提供线程。同样在该层上可以实现基于SSL的安全链接。服务器也会为安全接入的每个客户端验证它所具有的操作权限。
2.第二层架构主要完成大多少的核心服务功能,如SQL接口,并完成缓存的查询,SQL的分析和优化及部分内置函数的执行。所有跨存储引擎的功能也在这一层实现,如过程、函数等。在该层,服务器会解析查询并创建相应的内部解析树,并对其完成相应的优化如确定查询表的顺序,是否利用索引等,最后生成相应的执行操作。如果是select语句,服务器还会查询内部的缓存。如果缓存空间足够大,这样在解决大量读操作的环境中能够很好的提升系统的性能。
3.存储引擎层,存储引擎真正的负责了MySQL中数据的存储和提取,服务器通过API与存储引擎进行通信。不同的存储引擎具有的功能不同,这样我们可以根据自己的实际需要进行选取。

并发控制和锁的概念

当数据库中有多个操作需要修改同一数据时,不可避免的会产生数据的脏读。这时就需要数据库具有良好的并发控制能力,这一切在MySQL中都是由服务器和存储引擎来实现的。
解决并发问题最有效的方案是引入了锁的机制,锁在功能上分为共享锁(shared lock)和排它锁(exclusive lock)即通常说的读锁和写锁。当一个select语句在执行时可以施加读锁,这样就可以允许其它的select操作进行,因为在这个过程中数据信息是不会被改变的这样就能够提高数据库的运行效率。当需要对数据更新时,就需要施加写锁了,不在允许其它的操作进行,以免产生数据的脏读和幻读。锁同样有粒度大小,有表级锁(table lock)和行级锁(row lock),分别在数据操作的过程中完成行的锁定和表的锁定。这些根据不同的存储引擎所具有的特性也是不一样的。
MySQL大多数事务型的存储引擎都不是简单的行级锁,基于性能的考虑,他们一般都同时实现了多版本并发控制(MVCC)。这一方案也被Oracle等主流的关系数据库采用。它是通过保存数据中某个时间点的快照来实现的,这样就保证了每个事务看到的数据都是一致的。详细的实现原理可以参考《高性能MySQL》第三版。

事务

  1. 简单的说事务就是一组原子性的SQL语句。可以将这组语句理解成一个工作单元,要么全部执行要么都不执行。在MySQL中可以使用如下命令操作事务:注意:默认MySQL中自动提交是开启的:
  2. 事务具有ACID的特性:
    原子性(atomicity):事务中的所有操作要么全部提交成功,要么全部失败回滚。
    一致性(consistency):数据库总是从一个一致性状态转换到另一个一致性状态。
    隔离性(isolation):一个事务所做的修改在提交之前对其它事务是不可见的。
    持久性(durability):一旦事务提交,其所做的修改便会永久保存在数据库中。
  3. 事务的隔离级别:在SQL标准中定义了四种隔离级别:
    READ UNCOMMITTED(读未提交):事务中的修改即使未提交也是对其它事务可见
    READ COMMITTED(读提交):事务提交后所做的修改才会被另一个事务看见,可能产生一个事务中两次查询的结果不同。
    REPEATABLE READ(可重读):只有当前事务提交才能看见另一个事务的修改结果。解决了一个事务中两次查询的结果不同的问题。
    SERIALIZABLE(串行化):只有一个事务提交之后才会执行另一个事务
  4. MySQL中可以利用如下语句查询并临时修改隔离级别:
  5. 死锁:两个或多个事务在同一资源上相互占用并请求锁定对方占用的资源,从而导致恶性循环的现象。MySQL的部分存储引擎能够检测到死锁的循环依赖并产生相应的错误。InnoDB引擎解决死锁的方案是将持有最少排它锁的事务进行回滚。

MySQL存储引擎及应用方案

  1. MySQL采用插件式的存储引擎架构,可以根据不同的需求为不同的表设置不同的存储引擎。可以通过如下命令显示数据库中表的状态信息,以user表为例,显示如下:
    Name:显示的是表名
    Engine:显示存储引擎,该表存储引擎为MyISAM
    Row_format:显示行格式,对于MyISAM有Dynamic、Fixed和Compressed三种。分别表示表中有可变的数据类型,表中数据类型为固定的,以及表是压缩表的环境。
    Rows:显示表中行数
    Avg_row_length:平均行长度(字节)
    Data_length:数据长度(字节)
    Max_data_length:最大存储数据长度(字节)
    Data_free:已分配但未使用的空间,包括删除数据空余出来的空间
    Auto_increment:下一个插入行自动增长字段的值
    Create_time:表的创建时间
    Update_time:表数据的最后修改时间
    Collation:表的默认字符集及排序规则
    Checksum:如果启用,表示整个表的实时校验和
    Create_options:创建表示的一些其它选项
    Comment:额外的一些注释信息,根据存储引擎的不同表示的内容也不胫相同。

  2. 存储引擎介绍:
    InnoDB引擎:
    1.将数据存储在表空间中,表空间由一系列的数据文件组成,由InnoDB管理;
    2.支持每个表的数据和索引存放在单独文件中(innodb_file_per_table);
    3.支持事务,采用MVCC来控制并发,并实现标准的4个事务隔离级别,支持外键;
    4.索引基于聚簇索引建立,对于主键查询有较高性能;
    5.数据文件的平台无关性,支持数据在不同的架构平台移植;
    6.能够通过一些工具支持真正的热备。如XtraBackup等;
    7.内部进行自身优化如采取可预测性预读,能够自动在内存中创建hash索引等。
    MyISAM引擎:
    1.MySQL5.1中默认,不支持事务和行级锁;
    2.提供大量特性如全文索引、空间函数、压缩、延迟更新等;
    3.数据库故障后,安全恢复性差;
    4.对于只读数据可以忍受故障恢复,MyISAM依然非常适用;
    5.日志服务器的场景也比较适用,只需插入和数据读取操作;
    6.不支持单表一个文件,会将所有的数据和索引内容分别存在两个文件中;
    7.MyISAM对整张表加锁而不是对行,所以不适用写操作比较多的场景;
    8.支持索引缓存不支持数据缓存。
    Archive引擎:
    1.只支持insert和select操作;
    2.缓存所有的写数据并进行压缩存储,支持行级锁但不支持事务;
    3.适合高速插入和数据压缩,减少IO操作,适用于日志记录和归档服务器。
    Blackhole引擎:
    1.没有实现任何存储机制,会将插入的数据进行丢弃,但会存储二进制日志;
    2.会在一些特殊需要的复制架构的环境中使用。
    CSV引擎:
    1.可以打开CSV文件存储的数据,可以将存储的数据导出,并利用excel打开;
    2.可以作为一种数据交换的机制,同样经常使用。
    Memory引擎:
    1.将数据在内存中缓存,不消耗IO;
    2.存储数据速度较快但不会被保留,一般作为临时表的存储被使用。
    Federated引擎:
    能够访问远程服务器上的数据的存储引擎。能够建立一个连接连到远程服务器。
    Mrg_MyISAM引擎:
    将多个MYISAM表合并为一个。本身并不存储数据,数据存在MyISAM表中间。
    NDB集群引擎:
    MySQL Cluster专用。

  3. 第三方存储引擎:
    1.OLTP类:
    XtraDB:InnoDB的改进版本。
    PBXT:类似InnoDB,但提供引擎级别的复制和外键约束,适当支持SSD存储。
    TokuDB(开源):支持分形树索引结构,支持海量数据的分析。
    2.列式存储引擎:MySQL默认是面向行的存储
    Infobright: 支持数十TB的数据量,为数据分析和数据仓库设计的。数据高度压缩。
    InfiniDB:可以在一组集群间做分布式查询,有商业版但没有典型应用案例。
    3.社区存储引擎:
    Aria:解决MyISAM崩溃安全恢复问题,并能够进行数据缓存。
    Groona: 全文索引引擎。
    QQGraph: 由Open query研发支持图操作,比如查找两点间最短距离。
    SphinxSE: 该引擎为Sphinx全文索引搜索服务器提供SQL接口。
    Spider: 支持sharding并能够基于分片实现并列查询。
    VPForMySQL: 支持垂直分区。
    4.存储引擎选取参考因素
    1.是否有事务需求
    如果需要事务支持最好选择InnoDB或者XtraDB,如果主要是select和insert操作MyISAM比较合适,一般使用日志型的应用。
    2.备份操作需求
    如果能够关闭服务器进行备份,那么该因素可以忽略,如果需要在线进行热备份,则InnoDB引擎是一个不错的选择。
    3.故障恢复需求
    在对恢复要求比较好的场景中推荐使用InnoDB,因为MyISAM数据损坏概率比较大而且恢复速度比较慢。
    4.性能上的需求
    有些业务需求只有某些特定的存储引擎才能够满足,如地理空间索引也只有MyISAM引擎支持。所以在应用架构需求环境中也需要管理员折衷考虑,当然从各方面比较而言,InnoDB引擎还是默认应该被推荐使用的。

  4. 表引擎转换方法
    a. 直接修改

    b. 备份修改
    利用mysqldump备份工具将数据导出,修改create table语句中的存储引擎选项。注意修改的同时修改表名。
    c. 创建插入

    参考链接:
    https://www.cnblogs.com/daijw/p/9250331.html
    https://blog.csdn.net/wypersist/article/details/79838591

Mysql工作原理介绍相关推荐

  1. Express中间件工作原理介绍

    Express中间件工作原理介绍 中间件是Express框架学习中最难的部分,同时也是最为核心的技术,我们的学习路线如下 1.什么是中间件 2.Express中间件的本质及工作原理 3.自定义解析po ...

  2. 超详细的MySQL工作原理 体系结构

    超详细的MySQL工作原理 体系结构 妖精的杂七杂八 2020-08-13 13:54:12 了解MySQL(超详细的MySQL工作原理 体系结构) 1.MySQL体系结构 2.MySQL内存结构 3 ...

  3. 时间同步装置(卫星时钟同步)工作原理介绍

    时间同步装置(卫星时钟同步)工作原理介绍 时间同步装置(卫星时钟同步)工作原理介绍 微软从Windows2000开始,系统就支持使用NTP同步的方式获取时间,Windows系统默认的时间源都来自tim ...

  4. 【原理】#01红外热成像仪的工作原理介绍

    红外热成像仪是电测中比较特殊的一种仪器设备,在温度测试领域有着广泛的应用. 红外热成像仪测温的原理是怎么样的?如何选择合适的热成像仪? 安泰小课堂将分两期视频为大家进行揭秘. 本期内容将重点讲解红外热 ...

  5. 石英加速度计工作原理介绍

    石英加速度计工作原理介绍 加速度是一种用来反映物体在运动过程中的速度变化状态的物理量,其无法直接测量,当前的加速度传感器(加速度计)采用间接测量以及力的平衡等技术来获取物体的加速度.加速度传感器的工作 ...

  6. 三维电子罗盘的工作原理介绍

    三维电子罗盘的工作原理介绍 三维电子罗盘工作原理介绍 是由三维电子罗盘由三维磁阻传感器.双轴倾角传感器和MCU构成.三维磁阻传感器用来测量地球磁场,倾角传感器是在磁力仪非水平状态时进行补偿:MCU处理 ...

  7. 了解MySQL(超详细的MySQL工作原理 体系结构)

    了解MySQL(超详细的MySQL工作原理 体系结构) 1.MySQL体系结构 2.MySQL内存结构 3.MySQL文件结构 4.innodb体系结构 一.了解MySQL前你需要知道的 引擎是什么: ...

  8. cache相关概念及工作原理介绍

    cache相关概念及工作原理介绍 笔者这篇文章主要从使用者的角度介绍cache的相关概念和工作原理. 一. cache是什么,为什么要用它 关于cache是什么,为什么要用它.我们从这个表格说起.下图 ...

  9. 番茄土豆 for Mac工作原理介绍

    番茄土豆 for Mac是一款可以有效管理用户时间任务的软件.让你能够合理的安排自己的时间,比如制定什么样的计划,而且支持计划暂停,在你休息的时候,或者娱乐的时候暂停时间确保你能够完全完成自己制定的任 ...

最新文章

  1. 服务器计费系统安卓,GitHub - NWAFU/dms_client: 服务器计费系统(客户机端):用于统计租户的服务器使用情况...
  2. 【leetcode】85. Maximal Rectangle 0/1矩阵的最大全1子矩阵
  3. 基于hsv的亮度调整算法_改变HSV的H和V部分(比如可以增加图像亮度)
  4. java 建立网站_建立基本的Java Web站点
  5. python如何绘制两点间连线_如何利用Python的pyecharts绘制3d柱形图?
  6. python全栈开发 * 08知识点汇总 * 180608
  7. 透明化网络管理,事前处理实现轻松运维
  8. 【人脸识别】LFW数据集介绍
  9. PHP怎么接收字符串,求大神救命!!php接收到是空的字符串
  10. 在Linux使用exec执行命令时报的哪些错
  11. UVA10179 Irreducable Basic Fractions【欧拉函数+数论】
  12. shell 字符串包含关系
  13. 【STM32F103C8T6】 TTL转usb下载程序
  14. jed后缀是什么文件?什么作用呢?
  15. 从金蝶k3到金税盘_金蝶K3操作流程(全篇)
  16. 关于 Uncaught ReferenceError: mOxie is not defined情况下的问题
  17. VS2013 简单MFC应用以及teechart使用方法
  18. Linux Github 使用 ssh 登录及推送 - 一站式教程
  19. 红绿灯记忆游戏-第13届蓝桥杯Scratch选拔赛真题精选
  20. 不经意间的疏忽:Kb/KB与Kbps/KBps

热门文章

  1. 搜狗输入法——自定义短语设置
  2. 首款国风链游打造视觉“饕餮盛宴” 见证元宇宙数字资产变革新峰
  3. 论文阅读 Glow: Generative Flow with Invertible 1×1 Convolutions
  4. instagram封号的原因解析
  5. MFC中在界面上添加背景图片的方法
  6. 求勾股数元祖(java)
  7. 把你的面子撕下来扔到地上,狠狠踹几脚!
  8. 从工厂运作的实质看生产
  9. 腾讯云学生服务器如何购买
  10. R 用回归来做 ANOVA