一条sql是如何执行的详解
一条sql是如何执行的详解
1. SQL 解析(Parsing)
2. 查询重写(Query Rewrite)
3. 查询规划(Query Planning)
4. 查询执行(Query Execution)
5. 结果返回
示例:查询执行流程
总结
| 🎈边走、边悟🎈迟早会好 |
一条 SQL 查询在 PostgreSQL(以及大多数关系型数据库)中的执行过程可以分为多个阶段。每个阶段都对应特定的任务,从 SQL 解析到最终获取查询结果。以下是 SQL 查询执行过程的详细拆解:
1. SQL 解析(Parsing)
当用户提交一条 SQL 语句后,PostgreSQL 首先进入解析阶段。这个阶段主要有以下几个步骤:
- 词法分析:首先,SQL 语句被分解为单独的词法单元(tokens),如关键字、表名、列名、操作符等。
- 语法分析:接下来,解析器(parser)根据 SQL 语法规则,检查 SQL 语句是否符合 SQL 语法。例如,
SELECT是否紧跟着字段名等。 - 语义分析:如果语法检查通过,系统会进行语义分析。例如,验证表名和列名是否存在于数据库的元数据中。
输出:在这个阶段,SQL 语句被转换为一个内部的解析树(parse tree)。
2. 查询重写(Query Rewrite)
在解析树生成后,PostgreSQL 会检查是否有任何规则(rules)适用,并根据这些规则对查询进行重写。重写规则(如视图的定义)可能会改变原始的 SQL 查询,生成新的查询树。
例如:
- 当你查询视图时,查询会被重写为对基础表的查询。
- 应用触发器或规则也可能会重写查询。
输出:生成经过重写的查询树。
3. 查询规划(Query Planning)
这个阶段,查询规划器(Query Planner)负责将重写后的查询树转换为执行计划。查询规划器会决定如何最有效地访问数据,主要涉及以下步骤:
- 候选执行计划生成:查询规划器生成多个可能的执行计划。例如:
- 使用顺序扫描(Sequential Scan)扫描表中的所有行。
- 使用索引扫描(Index Scan)根据索引快速定位数据。
- 是否需要执行连接(JOIN)操作,以及选择哪种连接算法(嵌套循环、哈希连接、归并连接)。
- 成本估算(Cost Estimation):查询规划器会为每个候选计划估算成本。成本基于以下因素:
- I/O 成本:数据从磁盘读取到内存的成本。
- CPU 成本:处理每行数据的计算成本。
- 行数估计:查询中每个步骤的结果集大小估计。
PostgreSQL 使用统计信息(如表中行的数量、索引的选择性、列的分布等)来进行成本估算。
- 选择最佳计划:根据每个执行计划的估算成本,选择成本最低的执行计划。
输出:生成最终的执行计划(execution plan),这是系统决定如何执行查询的详细步骤。
4. 查询执行(Query Execution)
一旦执行计划确定下来,查询执行器(Query Executor)开始按照计划一步步执行操作。主要的执行步骤包括:
-
扫描(Scan):执行器按照计划选择的扫描方式(如顺序扫描、索引扫描)读取数据。
- 如果是顺序扫描,则逐行读取表中的数据。
- 如果是索引扫描,则使用索引来定位特定的行。
-
过滤(Filter):对于每一行数据,执行器会根据
WHERE子句条件进行过滤,确保仅保留符合条件的行。 -
连接(Join):如果查询涉及多个表,执行器会根据选择的连接算法(如嵌套循环连接、哈希连接)对这些表的数据进行连接处理。
-
排序(Sort)和分组(Group):如果查询要求对数据进行排序(
ORDER BY)或分组(GROUP BY),执行器会在获取数据后进行这些操作。 -
投影(Projection):执行器会根据
SELECT子句中的字段选择要返回的列,并忽略未被选中的列。 -
返回结果:最终结果集根据执行计划一步步执行并返回给客户端。
5. 结果返回
执行器生成的结果集会逐行或批量地返回给客户端,直到所有匹配的记录都返回。
示例:查询执行流程
假设你有一个简单的查询:
SELECT name, salary FROM employees WHERE department_id = 10 ORDER BY salary DESC;
-
SQL 解析:
- 解析器将 SQL 拆解为标识符:
SELECT、name、salary、employees、WHERE、department_id、ORDER BY、DESC。 - 检查
employees表是否存在,name、salary、department_id是否是合法字段。
- 解析器将 SQL 拆解为标识符:
-
查询重写:
- 如果
employees是一个视图,SQL 会被重写为查询基础表。
- 如果
-
查询规划:
- PostgreSQL 会分析是否有适合
department_id的索引。如果有索引,可以使用索引扫描来提高效率。 - 生成多个候选计划,例如顺序扫描、索引扫描,并计算各自的成本。
- 选择成本最低的计划。假设选择了索引扫描方式。
- PostgreSQL 会分析是否有适合
-
查询执行:
- 执行器根据选择的计划,使用索引扫描从
employees表中查找department_id = 10的记录。 - 过滤不符合条件的行。
- 根据
salary列对数据进行排序。
- 执行器根据选择的计划,使用索引扫描从
-
结果返回:
- 按
salary排序后的记录逐行返回给客户端。
- 按
总结
SQL 查询的执行过程分为解析、查询重写、查询规划、查询执行和结果返回五个主要步骤。每个步骤都对应特定的任务,从解析 SQL 到最终返回结果,确保查询尽可能高效地执行
🌟感谢支持 听忆.-CSDN博客
| 🎈众口难调🎈从心就好 |
相关文章:
一条sql是如何执行的详解
一条sql是如何执行的详解 1. SQL 解析(Parsing) 2. 查询重写(Query Rewrite) 3. 查询规划(Query Planning) 4. 查询执行(Query Execution) 5. 结果返回 示例:查询执…...
“先天项目经理圣体”丨超适合做项目经理的4种人
总有人在问,什么样的人适合做项目经理,当项目经理需要什么样的特质? 你别说,还真有那么一些人是“先天项目经理圣体”,天生就是吃项目经理这碗饭的。 沟通达人丨靠“嘴”走天下 我们知道项目经理大部分的时间都在进行…...
如何从object中抽取某几个值,然后转换成数组
可以使用Object.entries(), Array.prototype.filter()和Array.prototype.map()或者解构赋值的方式从对象中抽取某些值并转换为数组 示例 1:使用 Object.entries(), filter() 和 map() const obj {a: 1,b: 2,c: 3,d: 4 };const keysToExtract [a, c];const extr…...
数据结构(14)——哈希表(1)
欢迎来到博主的专栏:数据结构 博主ID:代码小豪 文章目录 哈希表的思想映射方法(哈希函数)除留余数法 哈希表insert闭散列负载因子扩容find和erase 哈希表的思想 在以往的线性表中,查找速度取决于线性表是否有序&#…...
K近邻算法_分类鸢尾花数据集
import numpy as np import pandas as pd from sklearn.datasets import load_iris from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score1.数据预处理 iris load_iris() df pd.DataFrame(datairis.data, columnsiris.featur…...
nacos和eureka的区别详解
Nacos 和 Eureka 都是服务发现和注册中心的解决方案,但它们在功能、设计和使用场景上有所不同。以下是它们的详细区别: 1. 基本概念 Eureka:是由 Netflix 开发的服务发现工具。它主要用于 Java 微服务架构中的服务注册与发现。Eureka 通过 R…...
AI大模型包含哪些些技术?
Prompt Prompt提示是模型接收以生成响应或完成任务的初始文本输入。 我们给AI一组Prompt输入,用于指导模型生成响应以执行任务。这个输入可以是一个问题、一段描述、一组关键词,或任何其他形式的文本,用于引导模型产生特定内容的响应。 Tra…...
分布式技术概览
文章目录 分布式技术1. 分布式数据库(Distributed Databases)2. 分布式文件系统(Distributed File Systems)3. 分布式哈希表(Distributed Hash Tables, DHTs)4. 分布式缓存(Distributed Caching…...
动手学习RAG: moka-ai/m3e 模型微调deepspeed与对比学习
动手学习RAG: 向量模型动手学习RAG: moka-ai/m3e 模型微调deepspeed与对比学习动手学习RAG:迟交互模型colbert微调实践 bge-m3 1. 环境准备 pip install transformers pip install open-retrievals注意安装时是pip install open-retrievals,但调用时只…...
Nacos rce-0day漏洞复现(nacos 2.3.2)
Nacos rce-0day漏洞复现(nacos 2.3.2) NACOS是 一个开源的服务发现、配置管理和服务治理平台,属于阿里巴巴的一款开源产品。影像版本:nacos2.3.2或2.4.0版本指纹:fofa:app“NACOS” 从 Github 官方介绍文档可以看出国…...
yjs04——matplotlib的使用(多个坐标图)
1.多个坐标图与一个图的折线对比 1.引入包;字体(同) import matplotlib.pyplot as plt import random plt.rcParams[font.family] [SimHei] plt.rcParams[axes.unicode_minus] False 2.创建幕布 2.1建立图层幕布 一个图:plt.fig…...
MOS管和三极管有什么区别?
MOS管是基于金属-氧化物-半导体结构的场效应晶体管,它的控制电压作用于氧化物层,通过调节栅极电势来控制源漏电流。MOS管是FET中的一种,现主要用增强型MOS管,分为PMOS和NMOS。 MOS管的三个极分别是G(栅极),D(漏极)&…...
医院多参数空气质量监控和压差监测系统简介@卓振思众
在现代医院管理中,确保患者和医疗人员的健康与安全是首要任务。为实现这一目标,医院需要依赖高科技设施来维持最佳的环境条件。特别是,多参数空气质量监测系统和压差监测系统在这一方面发挥了不可替代的作用。【卓振思众】多参数空气质量监测…...
[项目实战]EOS多节点部署
文章总览:YuanDaiMa2048博客文章总览 EOS多节点部署 (一)环境设计(二)节点配置(三)区块信息同步(四)启动节点并验证同步EOS单节点的环境如何配置 (一…...
setImmediate() vs setTimeout() 在 JavaScript 中的区别
setImmediate() vs setTimeout() 在 JavaScript 中的区别 在 JavaScript 中,setImmediate() 和 setTimeout() 都用于调度任务,但它们的工作方式不同。 JavaScript 的异步特性 JavaScript 以其非阻塞、异步行为而闻名,尤其是在 Node.js 环境…...
【Java文件操作】文件系统操作文件内容操作
文件系统操作 常见API 在Java中,File类是用于文件和目录路径名的抽象表示。以下是一些常见的方法: 构造方法: File(String pathname):根据给定的路径创建一个File对象。File(String parent, String child):根据父路径…...
关于若依flowable的安装
有个项目要使用工作流功能,在网上看了flowable的各种资料,最后选择用若依RuoYi-Vue-Flowable这个项目来迁移整合。 一、下载项目代码: 官方项目地址:https://gitee.com/shenzhanwang/Ruoyi-flowable/ 二、新建数据库ÿ…...
猜数字困难版(1-10000)
小游戏,通过提示每次猜高或猜低以及每次猜中的位数,10次内猜中1-10000的一个数。 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthde…...
ASPICE术语表
术语来源描述活动Automotive SPICE V4.0由利益相关方或参与方执行的任务用参数Automotive SPICE V4.0应用参数是包含了在系统或软件层级可被更改的数据的软件变量,他们影响系统或软件的行为和属性。应用参数的概念有两种表达方式:规范(分别包括变量名称、值域范围、…...
Knife4j:打造优雅的SpringBoot API文档
1. 为什么需要API文档? 在现代软件开发中,API文档的重要性不言而喻。一份清晰、准确、易于理解的API文档不仅能够提高开发效率,还能降低前后端沟通成本。今天,我们要介绍的Knife4j正是这样一款强大的API文档生成工具,它专为Spring Boot项目量身打造,让API文档的生成…...
OpenVoice语音合成技术全解析:从痛点突破到多场景落地实践
OpenVoice语音合成技术全解析:从痛点突破到多场景落地实践 【免费下载链接】OpenVoice 项目是MyShell AI开源的即时语音克隆技术OpenVoice,旨在提供一种能够快速从少量语音样本中准确复制人类声音特征,并实现多种语言及语音风格转换的解决方案…...
Open Webాలు架构设计:构建高性能自托管AI平台的工程实践
Open Webాలు架构设计:构建高性能自托管AI平台的工程实践 【免费下载链接】open-webui Open WebUI 是一个可扩展、功能丰富且用户友好的自托管 WebUI,设计用于完全离线操作,支持各种大型语言模型(LLM)运行器…...
Vue3实战:5分钟搞定全局WebSocket封装(含心跳检测与断线重连)
Vue3全局WebSocket封装实战:心跳检测与断线重连的最佳实践 WebSocket在现代Web应用中扮演着越来越重要的角色,特别是在需要实时数据更新的场景中。Vue3作为当前最流行的前端框架之一,与WebSocket的结合能够为开发者提供强大的实时交互能力。本…...
苹果M系列芯片用户必看:三步搞定iOS游戏在Mac上的完美运行方案
苹果M系列芯片用户必看:三步搞定iOS游戏在Mac上的完美运行方案 【免费下载链接】PlayCover Community fork of PlayCover 项目地址: https://gitcode.com/gh_mirrors/pl/PlayCover 还在为Mac上无法畅玩心爱的iOS游戏而烦恼吗?你是否想过ÿ…...
乙巳马年春联生成终端效果展示:Ma Shan Zheng字体巨幅卷轴实拍
乙巳马年春联生成终端效果展示:Ma Shan Zheng字体巨幅卷轴实拍 1. 引言:一场数字时代的“开门见喜” 想象一下,你站在一扇威严的朱红大门前,门上是整齐排列的金色门钉,两侧是古老的门神画像。你只需轻声说出一个新年…...
万物识别镜像实战案例:如何用MySQL管理上万张图片识别结果?
万物识别镜像实战案例:如何用MySQL管理上万张图片识别结果? 1. 引言 当你使用万物识别模型处理了成千上万张图片后,是否遇到过这样的困扰:识别结果散落在各处,想要查找某张特定图片的识别记录时无从下手?…...
10倍加速PDF转HTML:pdf2htmlEX终极优化指南
10倍加速PDF转HTML:pdf2htmlEX终极优化指南 【免费下载链接】pdf2htmlEX Convert PDF to HTML without losing text or format. 项目地址: https://gitcode.com/gh_mirrors/pd/pdf2htmlEX pdf2htmlEX是一款能够将PDF文件转换为HTML格式的强大工具,…...
BiliTools跨平台哔哩哔哩工具箱:从入门到精通的全方位指南
BiliTools跨平台哔哩哔哩工具箱:从入门到精通的全方位指南 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持视频、音乐、番剧、课程下载……持续更新 项目地址: https://gitcode.com/GitHub_Trending/bilit/…...
可视化是对比原始数据和填补数据的强大工具。你可以使用箱线图、密度图或散点图来可视化原始数据和填补后的数据
下面的内容摘录自《用R探索医药数据科学》专栏文章的部分内容(原文5665字)。 2篇2章6节:R的多重填补法中随机回归填补法的应用,MICE包的实际应用和统计与可视化评估-CSDN博客 在数据分析中,缺失数据是常见且具有挑战性…...
3分钟上手!FrankMocap让普通摄像头变身专业动捕设备
3分钟上手!FrankMocap让普通摄像头变身专业动捕设备 【免费下载链接】frankmocap A Strong and Easy-to-use Single View 3D HandBody Pose Estimator 项目地址: https://gitcode.com/gh_mirrors/fr/frankmocap 在数字内容创作与交互设计领域,3D动…...
