当前位置：首页 > news >正文

MySQL —— MySQL逻辑架构与查询过程

news 2026/5/13 4:42:39

文章目录

MySQL逻辑架构整体分为三层
- 连接层
- 服务层
- - 查询缓存
  - 解析器
  - 优化器
  - 执行器
- 存储引擎层
- 系统文件层
MySQL 查询过程
- 查询过程框图

博客1

博客2

MySQL逻辑架构整体分为三层

在这里插入图片描述

最上层为客户端层，并非MySQL所独有，诸如：连接管理、授权认证、权限校验等功能均在这一层处理。
MySQL大多数核心服务均在中间这一层，包括查询解析、优化、执行、缓存、内置函数(比如：时间、数学、加密等函数)。所有的跨存储引擎的功能也在这一层实现：存储过程、触发器、视图等。
最下层为存储引擎，其负责 MySQL 中的数据存储和提取。和 Linux 下的文件系统类似，每种存储引擎都有其优势和劣势。中间的服务层通过API与存储引擎通信，这些API接口屏蔽了不同存储引擎间的差异。

连接层

连接层主要负责连接管理、授权认证、权限校验等功能。

连接管理：

负责客户端与 MySQL 服务器之间的连接建立、维护和终止。客户端发起连接请求，MySQL 服务器接收到请求；每个客户端连接对应服务器上的一个线程，服务器利用线程池来管理这些连接，避免频繁创建和销毁线程，提高效率；当客户端请求断开连接时，服务器会关闭相应的线程，释放资源；
身份认证：

在客户端输入连接命令（如 mysql -uxxx -pxxx）后，连接层的第一步是进行身份验证。通过用户名和密码进行认证，确保只有授权用户才能访问数据库。还支持 SSL 证书认证，提供更高级别的安全性，确保数据在传输过程中不被窃取。认证成功后，服务器会加载用户的权限信息。
权限校验：

登录后，连接层会检查用户是否有执行特定操作的权限。这包括对数据库、表和其他资源的访问控制，确保用户只能访问其权限范围内的数据。如果权限不足，服务器会拒绝该请求，并返回相应的错误信息。
比如输入的 mysql -uxxx -pxxx 之后，来到MySQL的第一件事就是校验身份，权限等。每个客户端连接都对应着服务器上的一个线程。服务器上维护了一个线程池，避免为每个连接都创建销毁一个线程。当客户端连接到 MySQL 服务器时，服务器对其进行认证。可以通过用户名与密码认证，也可以通过 SSL 证书进行认证。登录认证后，服务器还会验证客户端是否有执行某个查询的操作权限。

服务层

认证成功过后，接下来就来到服务层了，服务层是 MySQL 的核心，MySQL 的核心服务层都在这一层，包括要执行的任何 SQL 语句，普通的 DDL、DML、DQL、存储过程、视图、触发器等都需要经过这一层的一些操作，最终才可以被 MySQL 识别。主要经过有 SQL 解析器、SQL 优化器等，最终还会经过查询缓存，总之，所有跨存储引擎的功能都在这一层实现。

查询缓存

在执行 SELECT 语句之前，MySQL 会检查查询缓存（Query Cache）。如果相同的 SQL 查询请求已经存在于缓存中，MySQL 会直接返回缓存中的结果，服务器就不需要再执行查询解析、优化和执行的整个过程；
对于相同的查询请求，可以快速返回结果，减少处理时间。但不推荐使用查询缓存，为什么呢？因为查询缓存往往弊大于利。一旦对表进行任何更新（如 INSERT、UPDATE 或 DELETE），该表上的所有查询缓存都会被清空。这导致在高更新频率的数据库中，查询缓存的命中率很低，反而会影响性能。除非业务需求中需要使用一张静态表，很长时间才会更新一次，比如系统配置表，那这张表上的查询才适合使用查询缓存。MySQL8.0 彻底废弃了查询缓存的功能，MySQL 8.0 的设计更注重高效的查询处理和优化，而不是依赖查询缓存。
虽然查询缓存已被废弃，但在早期版本中，开发者仍然可以通过设置 query_cache_type 参数来控制缓存行为。可以将参数 query_cache_type 设置成DEMAND，这样对于默认的 SQL 语句都不使用查询缓存。

解析器

如果缓存没有命中的话，MySQL 解析器会对查询语句进行进行语法和语义分析，确保 SQL 语句符合 SQL 标准，并且逻辑上正确。解析的结果生成一个内部表示，这个表示用于后续的优化和执行。简单说解析的作用将我们人能看懂的 SQL 解析成 MySQL 能识别的语言；
解析器先会做 “词法解析”。词法解析是一种将输入的 SQL 语句分解为基本组成部分的过程，这些组成部分称为“词法单元”。MySQL 会识别出 SQL 语句中的关键字（如 SELECT、FROM、WHERE 等）、表名、列名等，并将其分类。也就是 MySQL 需要识别出里面的字符串分别是什么，代表什么；
做完“词法解析”，接着做“语法解析”。语法解析基于词法解析的结果，检查 SQL 语句的结构是否符合 MySQL 的语法规则，判断输入的这个 SQL 语句是否满足 MySQL 语法。如果语法正确，语法解析器会生成一个语法树（或解析树），这是 SQL 语句的内部表示形式，便于后续处理；

优化器

经过了解析器器，MySQL 知道要做什么了。接下来并不是直接执行，而是会在优化器这一层进行优化，优化器是个非常复杂的部件，它会按照它认为的最好的方式去优化这条 SQL 语句，并生成一条条的执行计划。

优化过程可能包括选择合适的索引、确定连接顺序、重写查询等，以提高查询性能：
- 索引选择：当查询涉及多个索引时，优化器会评估每个索引的使用效率，决定采用哪个索引进行查询。这包括考虑索引的选择性、数据分布等因素；
- 连接顺序优化：在执行多表关联（JOIN）时，优化器会决定表的连接顺序。不同的连接顺序可能会导致不同的查询效率，优化器会选择最优的顺序；
- 查询重写：优化器可以对 SQL 语句进行重写，以简化查询并提升性能。例如，它可能会将某些子查询转换为 JOIN，从而减少数据处理的复杂性；
例如在表里面有多个索引的时候，决定使用哪个索引；或者在一个语句有多表关联（join）的时候，决定各个表的连接顺序。比如你执行下面这样的语句，这个语句是执行两个表的join：
```
mysql> select * from t1 join t2 using(ID)  where t1.c=10 and t2.d=20;
```
- 既可以先从表t1里面取出c=10的记录的ID值，再根据ID值关联到表t2，再判断t2里面d的值是否等于20。
- 也可以先从表t2里面取出d=20的记录的ID值，再根据ID值关联到t1，再判断t1里面c的值是否等于10。
  
  这两种执行方法的逻辑结果是一样的，但是执行的效率会有不同，而优化器的作用就是决定选择使用哪一个方案。
优化器阶段完成后，这个语句的执行方案就确定下来了，然后进入执行器阶段。

执行器

MySQL 通过解析器知道了你要做什么，通过优化器知道了该怎么做，于是就进入了执行器阶段。执行器会根据优化器生成的执行计划，去调用执行引擎会调用相应的存储引擎接口，进行数据的读取、插入、更新和删除操作；

在执行 SQL 语句之前，执行器会首先检查用户对目标表的操作权限；

mysql> select * from T where ID=10;
ERROR 1142 (42000): SELECT command denied to user 'b'@'localhost' for table 'T'

如果有权限，就打开表继续执行。打开表的时候，执行器根据表的存储引擎定义，使用相应的存储引擎接口打开表；
比如上述sql查询表T语句，ID字段没有索引，执行器的执行流程处理流程：
1. 调用 InnoDB 引擎接口，读取表的第一行数据，检查 ID 值是否为 10。如果 ID 值不匹配，则跳过这行；如果匹配，则将该行添加到结果集中；
2. 继续调用引擎接口获取“下一行”数据，重复上述检查逻辑，直到遍历完整个表；
3. 执行器将上述遍历过程中所有满足条件的行组成的记录集作为结果集返回给客户端。
对于有索引的表，执行的逻辑与无索引的表类似，但效率更高。
1. 执行器首先调用引擎接口，获取满足条件的第一行数据，由于索引的存在，查找和定位数据的过程更为高效；
2. 通过调用接口，循环获取“满足条件的下一行”，直到没有更多匹配的行。每次获取时，执行器会根据索引的顺序直接定位到相关数据，减少了不必要的全表扫描；
3. 将所有满足条件的记录组成的结果集返回给客户端；

存储引擎层

根据优化器生成的执行计划，执行引擎负责实际的数据检索和操作。执行引擎会调用相应的存储引擎接口，进行数据的读取、插入、更新和删除操作；
MySQL 提供了可插拔式的存储引擎，即 “插上什么存储引擎，就有什么功能”，存储引擎真正的负责了 MySQL 中数据的存储和提取，服务器通过 API 与存储引擎进行通信，不同的存储引擎具有功能不同。不同的存储引擎将直接决定了数据存储到磁盘的方式。例如，InnoDB 使用聚簇索引存储数据，而 MyISAM 使用非聚簇索引；

系统文件层

系统文件层是 MySQL 逻辑架构中负责数据持久化和存储的底层组件。它主要涉及数据的存储与管理，确保数据能够安全、有效地写入磁盘，并与存储引擎进行交互。
- 数据存储：负责将数据以文件的形式存储在操作系统的文件系统中；
- 与存储引擎交互：系统文件层通过 API 与存储引擎进行通信，完成数据的写入和读取操作。这一层使存储引擎能够透明地处理数据存储的细节。

MySQL 查询过程

查询过程框图

我们总是希望MySQL能够获得更高的查询性能，最好的办法是弄清楚MySQL是如何优化和执行查询的。一旦理解了这一点，就会发现：很多的查询优化工作实际上就是遵循一些原则让MySQL的优化器能够按照预想的合理方式运行而已。

当向MySQL发送一个请求的时候，MySQL到底做了些什么呢？

在这里插入图片描述

接收请求

客户端连接：客户端通过连接管理与 MySQL 服务器建立连接，并发送 SQL 查询请求。
查询缓存（可选）

如果启用了查询缓存，MySQL 会检查该查询是否已有缓存的结果。如果缓存中存在该查询的结果，MySQL 会直接返回缓存结果，而无需执行查询。
查询解析

语法解析：MySQL 的查询解析器会检查 SQL 查询的语法，确保其符合 SQL 标准。

语义分析：解析器验证表名、列名是否存在，以及用户是否有权限执行该查询。
查询优化

生成执行计划：查询优化器分析解析后的 SQL 语句，生成一个或多个执行计划。

优化器使用统计信息（如表的行数、索引的选择性等）来评估不同的执行计划，并选择最优的执行路径。
执行查询

调用存储引擎：优化后的执行计划会被传递给执行引擎，MySQL 根据计划调用相应的存储引擎执行实际的数据操作。

数据检索：存储引擎根据执行计划从磁盘读取数据，进行必要的计算和处理（如连接、排序等）。
返回结果

结果集返回：执行引擎将结果集通过服务层返回给客户端。

连接管理：客户端接收到结果后，可以继续发送其他查询或关闭连接。

详解一条 SQL 的执行过程

MySQL —— MySQL逻辑架构与查询过程

文章目录 MySQL逻辑架构整体分为三层连接层服务层查询缓存解析器优化器执行器存储引擎层系统文件层 MySQL 查询过程查询过程框图博客1 博客2 MySQL逻辑架构整体分为三层最上层为客户端层，并非MySQL所独有，诸如：连接管理、授权认证、权限校…...

编程日记 2024/11/18 17:18:28

ODOO学习笔记（12）:自定义模块开发

一、Odoo模块结构基础基本目录结构 Odoo自定义模块通常有一个特定的目录结构。一个典型的模块目录包含以下文件和文件夹： __init__.py：这是一个Python模块初始化文件。它使得该目录被视为一个Python模块。在这个文件中，你可以通过from. impo…...

编程日记 2024/11/18 17:17:27

Excel单元格中自适应填充多图

实例需求：在Excel插入图片时，由于图片尺寸各不相同，如果希望多个图片填充指定单元格，依靠用户手工调整，不仅费时费力，而且很难实现完全填充。如下图中的产品图册，有三个图片，如下图所…...

编程日记 2024/11/18 17:12:19

20.useMediaQuery

React useMediaQuery 钩子：如何优雅地实现响应式设计？在现代 Web 开发中，响应式设计是一个关键概念，它允许应用根据不同的屏幕尺寸和设备特性调整其布局和行为。useMediaQuery 钩子提供了一种声明式的方法来在 React 组件中使用媒体查询，使得响应式逻辑的实现变得简单而…...

编程日记 2024/11/18 17:11:17

无人机场景 - 目标检测数据集 - 车辆检测数据集下载「包含VOC、COCO、YOLO三种格式」

数据集介绍：无人机场景车辆检测数据集，真实场景高质量图片数据，涉及场景丰富，比如无人机场景城市道路行驶车辆图片、无人机场景城市道边停车车辆图片、无人机场景停车场车辆图片、无人机场景小区车辆图片、无人机场景车辆遮挡、车…...

编程日记 2024/11/18 17:08:12

聚合查询（查询）

count:统计表中所有的行数指定某一列不统计NULL sum:求和 NULL值不参与计算（省略） avg()：对所有行的指定列求平均值 max（） min()：求所有指定行中最大值与最小值分组查询 group by: ROUDN()小数点 havin…...

编程日记 2024/11/18 17:05:08

QT QLineEdit失去焦点事件问题与解决

本文介绍如何获得QLineEdit的失去焦点事件和获得焦点的输入框也会触发失去焦点事件的问题！ 目录一、QLineEdit获得失去焦点事件 1.自定义类继承自QLineEdit 2.重写 focusOutEvent 3.使用二、失去焦点事件问题 1.问题描述 2.问题解决三、源码分享 lineed…...

编程日记 2024/11/18 17:02:05

Remora

Remora Remora 模型能够独立于碱基识别过程预测甲基化/修饰碱基的状态。Remora 仓库专注于准备修饰碱基训练数据和训练修饰碱基模型。此外，还提供了一些用于运行 Remora 模型和调查原始信号的功能。对于生产环境中的修饰碱基识别，建议使用 Dorado <https://github.com/na…...

编程日记 2024/11/18 17:01:03

MySQL中将一个字符串字段按层级树状展开

水善利万物而不争，处众人之所恶，故几于道💦 文章目录需求1.分析2.实现3.思路刨析表结构和数据需求数据库中有个字段如下如何将其转换为如下形式： 1.分析 1.他的层级个数是不确定的，也就是说有的有2层有的有5…...

编程日记 2024/11/18 16:59:00

vue面试题8|[2024-11-14]

问题1：什么是渐进式框架? vue.js router vuex element ...插件 vue.js 渐0 router 渐1 vuex 渐2 vue.js只是一个核心库，比如我再添加一个router或者vuex，不断让项目壮大，就是渐进式框…...

编程日记 2024/11/18 16:57:58

ARM（安谋） China处理器

0 Preface/Foreword 0.1 参考博客 Cortex-M23/M33与STAR-MC1星辰处理器 ARM China，2018年4月established，独立运行。 1 处理器类型 1.1 周易AIPU 1.2 STAR-MC1（星辰处理器） STAT-MC1，主要为满足AIOT应用性能、功…...

编程日记 2024/11/18 16:55:53

基于python Django的boss直聘数据采集与分析预测系统，爬虫可以在线采集，实时动态显示爬取数据，预测基于技能匹配的预测模型

本系统是基于Python Django框架构建的“Boss直聘”数据采集与分析预测系统，旨在通过技能匹配的方式对招聘信息进行分析与预测，帮助求职者根据自身技能找到最合适的职位，同时为招聘方提供更精准的候选人推荐。系统的核心预测模型基于职位需求技…...

编程日记 2024/11/18 16:52:49

MATLAB实现GARCH(广义自回归条件异方差)模型计算VaR(Value at Risk)

MATLAB实现GARCH(广义自回归条件异方差)模型计算VaR(Value at Risk) 1.计算模型介绍使用GARCH（广义自回归条件异方差）模型计算VaR（风险价值）时，方差法是一个常用的方法。GARCH模型能够捕捉到金融时间序列数据中的波…...

编程日记 2024/11/18 16:51:47

深入Linux基础：文件系统与进程管理详解

在Linux运维领域，文件系统和进程管理是两个至关重要的基础知识。理解它们的原理和实际操作，不仅有助于我们更高效地管理服务器，还能快速定位问题、优化性能。本文将带你全面了解这两大模块，并配以示例代码进行讲解，帮助…...

编程日记 2024/11/18 16:50:46

缓存及其不一致

在实际开发过程中，一般都会遇到缓存，像本地缓存（直接在程序里搞个map也可以，但是可能会随着数据的增长出现OOM，建议使用正经的本地缓存框架，因为自己实现淘汰策略啥的挺费劲的）、分布式缓存&…...

编程日记 2024/11/18 16:49:45

Leetcode 有效的数独

这段代码解决的是验证一个数独是否有效的问题，其算法思想是基于规则校验和状态记录。具体思想如下： 算法思想核心目标： 检查每个数字在同一行、同一列和同一个 3x3 子格中是否重复。状态记录： 使用 3 个布尔二维数组分别…...

编程日记 2024/11/18 16:48:43

《Java核心技术卷I》用户界面中首选项API

首选项API 在桌面程序中，通常都会存储用户首选项，如用户最后处理的文件、窗口的最后位置等。利用Properties类可以很容易的加载和保存程序的配置信息，但有以下缺点： 有些操作系统没有主目录概念，很难为匹配文件找到…...

编程日记 2024/11/18 16:46:39

Android 中的 Zygote 和 Copy-on-Write 机制详解

在 Android 系统中，Zygote 是一个关键的进程，几乎所有的应用进程都是通过它 fork（派生）出来的。通过 Zygote 启动新进程的方式带来了显著的性能优势，这得益于 fork 操作和 Linux 中的 Copy-on-Write（COW&am…...

编程日记 2024/11/18 16:43:33

【人工智能】从零开始用Python实现逻辑回归模型：深入理解逻辑回归的原理与应用

解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！ 逻辑回归是一种经典的统计学习方法，用于分类问题尤其是二分类问题。它通过学习数据的特征和目标标签之间的…...

编程日记 2024/11/18 16:42:32

推荐一款功能强大的光学识别OCR软件：Readiris Dyslexic

Readiris Dyslexic是一款功能强大的光学识别OCR软件，可以扫描任何纸质文档并将其转换为完全可编辑的数字文件(Word，Excel，PDF)，然后用你喜欢的编辑器进行编辑。该软件提供了一种轻松创建，修改和签名PDF的完整解决方法&…...

编程日记 2024/11/18 16:36:25

基于大语言模型的自动化信息处理系统：从RSS聚合到AI摘要的实践

1. 项目概述：一个能帮你“读”新闻的AI助手在信息爆炸的时代，每天光是处理订阅的RSS、关注的社交媒体动态、收藏的YouTube视频和没读完的长文，就足以让人精疲力尽。我们总想保持对行业趋势的敏感，却又被海量信息淹没&#xff0c…...

编程新知 2026/5/13 4:22:49

基于T4技术栈的现代全栈应用开发实践与最佳实践解析

1. 项目概述：一个现代全栈应用的原型与起点最近在GitHub上看到一个挺有意思的项目，叫timothymiller/t4-app。乍一看这个名字，可能有点摸不着头脑，但点进去你会发现，这其实是一个精心设计的全栈Web应用模板。它不是某个…...

编程新知 2026/5/13 3:15:47

开源机器人夹爪OpenClaw Max：从硬件组装到ROS集成的完整开发指南

1. 项目概述与核心价值最近在机器人抓取领域，一个名为 minakovai/openclaw-max-guide 的项目在社区里引起了不小的讨论。乍一看这个标题，它像是一个关于“OpenClaw Max”的开源指南或教程。但如果你深入挖掘，会发现它远不止于此。这实际上…...

编程新知 2026/5/13 2:51:22

智慧港口高风险作业AI实时监督技术实操解析

在智慧港口建设中，集装箱堆场、高风险作业的安全管控是核心重点，其中皮带运输、高风险作业（吊装、动火、高处、有限空间等）的安全保障，是港口运维的关键。当前，港口高风险作业普遍面临痛点：人工…...

编程新知 2026/5/13 2:51:07

企业采购AI升级：需求驱动的智能供应商匹配实战

工业数字化与 AI 技术深度融合的当下，传统采购招标模式的短板愈发凸显。众多 Java 架构的企业采购系统仍停留在人工化、经验化运营阶段，供应商管理效率低、匹配精准度不足、人力成本居高不下。依托JBoltAI企业级 Java AI 应用开发框架所倡导的 AIGS 人工…...

编程新知 2026/5/12 23:09:51

PCI总线‘对话’的艺术：主从设备如何通过FRAME#、STOP#信号优雅地‘开始’与‘结束’传输

PCI总线‘对话’的艺术：主从设备如何通过FRAME#、STOP#信号优雅地‘开始’与‘结束’传输在计算机系统的内部世界里，总线的数据传输就像一场精心编排的舞会。PCI总线作为这场舞会的舞台，主从设备之间的每一次交互都遵循着严格的礼仪规则。这…...

编程新知 2026/5/12 21:22:26

从SPI模式0到Quad I/O：手把手带你玩转W25Q128JV的性能压榨与接口升级

从SPI模式0到Quad I/O：W25Q128JV性能优化实战指南在嵌入式系统设计中，存储器的性能往往成为整个系统响应速度的瓶颈。W25Q128JV这颗128Mbit容量的串行Flash芯片，凭借其灵活的接口配置和出色的性价比，已成为众多物联网设备、消费电…...

编程新知 2026/5/12 20:52:43

国家级数据仓库构建：从爬取到应用的全流程实践指南

1. 项目概述与核心价值最近在整理一个数据项目时，我偶然发现了一个名为“national_data”的仓库，作者是Ddhjx。这个项目名听起来平平无奇，但点进去之后，我发现它远不止是一个简单的数据集合。它本质上是一个结构化的、持续更新的国…...

编程新知 2026/5/12 20:35:06

对比官方价格体验Taotoken活动价带来的直接成本节省

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度对比官方价格体验 Taotoken 活动价带来的直接成本节省在开发与使用大模型 API 的过程中，成本是每个开发者与团队都需要…...

编程新知 2026/5/12 20:07:29

初次使用Taotoken平台从注册到完成API调用的全程指引

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度初次使用Taotoken平台从注册到完成API调用的全程指引对于初次接触大模型API的开发者而言，从注册平台到成功发出第一个…...

编程新知 2026/5/12 19:41:07