当前位置：首页 > news >正文

『MySQL 实战 45 讲』16 - “order by” 是怎么工作的

news 2026/5/26 18:06:44

“order by” 是怎么工作的

首先创建一个表

CREATE TABLE `t` ( `id` int(11) NOT NULL, `city` varchar(16) NOT NULL, `name` varchar(16) NOT NULL, `age` int(11) NOT NULL, `addr` varchar(128) DEFAULT NULL, PRIMARY KEY (`id`), KEY `city` (`city`)
) ENGINE=InnoDB;

全字段排序

在 city 字段上创建索引，然后执行下面语句

select city,name,age from t where city='杭州' order by name limit 1000 ;

通过 explain 结果会出 Extra 字段中，出现 Using filesort，表示需要排序，MySQL 会给每个线程分配一块内存用于排序，称为 sort_buffer
上述语句执行流程如下

初始化 sort_buffer，确定放入 name、city、age 这三个字段
从索引 city 找到第一个满足 city='杭州’ 条件的主键 id，也就是图中的 ID_X
到主键 id 索引取出整行，取 name、city、age 三个字段的值，存入 sort_buffer 中
从索引 city 取下一个记录的主键 id
重复步骤 3、4 直到 city 的值不满足查询条件为止，对应的主键 id 也就是图中的 ID_Y
对 sort_buffer 中的数据按照字段 name 做快速排序
按照排序结果取前 1000 行返回给客户端

其中，排序的时候可能会用到外部排序，就需要设置 sort_buffer_size，避免导致 sort_buffer 太小而不得不利用磁盘临时文件来辅助排序
确定排序语句是否使用了临时文件的方法

/* 打开optimizer_trace，只对本线程有效 */
SET optimizer_trace='enabled=on'; /* @a保存Innodb_rows_read的初始值 */
SELECT VARIABLE_VALUE INTO @a FROM  performance_schema.session_status WHERE variable_name = 'Innodb_rows_read';/* 执行语句 */
SELECT city, NAME,age FROM t WHERE city='杭州' ORDER BY NAME LIMIT 1000; /* 查看 OPTIMIZER_TRACE 输出 */
SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G/* @b保存Innodb_rows_read的当前值 */
SELECT VARIABLE_VALUE INTO @b FROM performance_schema.session_status WHERE variable_name = 'Innodb_rows_read';/* 计算Innodb_rows_read差值 */
SELECT @b-@a;

其中，在 SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G 的内容中如果出现 number_of_tmp_files，就表明用了临时表的份数（8.0 版本好像没看着）

而 SELECT @b-@a; 代表的是查询前后获取的值的相减，得到的意思是整个过程扫描了多少行

如果发现值和预期值多 1，就需要设置 internal_tmp_disk_storage_engine 属性为 MyISAM（默认 InnoDB），可能是因为查询 OPTIMIZER_TRACE 时，用到了临时表，所以会加 1

rowid 排序

全字段排序会把要返回的字段放到 sort_buffer 中，如果字段太多，就会分成多个临表
当排序单行太大，MySQL 会用另外一种算法，例如更改 max_length_for_sort_data 专门用于控制排序的行数据参数

SET max_length_for_sort_data = 16;

city、name、age 这三个字段的定义总长度是 36 > 16，所以 sort_buffer 只会放入 排序的列 和 主键 id

初始化 sort_buffer，确定放入两个字段，即 name 和 id
从索引 city 找到第一个满足 city=‘杭州’ 条件的主键 id，也就是图中的 ID_X
到主键 id 索引取出整行，取 name、id 这两个字段，存入 sort_buffer 中
从索引 city 取下一个记录的主键 id
重复步骤 3、4 直到不满足 city='杭州’条件为止，也就是图中的 ID_Y
对 sort_buffer 中的数据按照字段 name 进行排序
遍历排序结果，取前 1000 行，并按照 id 的值回到原表中取出 city、name 和 age 三个字段返回给客户端
- 其中 “结果集” 是逻辑概念，实际上 MySQL 服务端从排序后的 sort_buffer 中依次取出 id，然后到原表查到 city、name 和 age 这三个字段的结果，不需要在服务端再耗费内存存储结果，是直接返回给客户端的

如果用刚刚的 确定临时文件的方法，会发现比以前多了一些值，就是因为要 id 去原表取值

联合索引与索引覆盖

对表的字段 city 和 name 的联合索引

alter table t add index city_user(city, name);

查询过程就变成下面这样

从索引 (city,name) 找到第一个满足 city='杭州’条件的主键 id
到主键 id 索引取出整行，取 name、city、age 三个字段的值，作为结果集的一部分直接返回
从索引 (city,name) 取下一个记录主键 id
重复步骤 2、3，直到查到第 1000 条记录，或者是不满足 city=‘杭州’ 条件时循环结束

通过 explain 查询，就发现没有出现 Using filesort
如果想更快，就进行索引覆盖吧

alter table t add index city_user_age(city, name, age);

执行流程将会如下

从索引 (city,name,age) 找到第一个满足 city=‘杭州’ 条件的记录，取出其中的 city、name 和 age 这三个字段的值，作为结果集的一部分直接返回
从索引 (city,name,age) 取下一个记录，同样取出这三个字段的值，作为结果集的一部分直接返回
重复执行步骤 2，直到查到第 1000 条记录，或者是不满足 city=‘杭州’ 条件时循环结束

『MySQL 实战 45 讲』16 - “order by” 是怎么工作的

“order by” 是怎么工作的首先创建一个表 CREATE TABLE t ( id int(11) NOT NULL, city varchar(16) NOT NULL, name varchar(16) NOT NULL, age int(11) NOT NULL, addr varchar(128) DEFAULT NULL, PRIMARY KEY (id), KEY city (city) ) ENGINEInnoDB;全字段排序在 cit…...

编程日记 2023/5/29 15:49:23

怎么给移动硬盘查错？移动硬盘查错能恢复数据吗

移动硬盘在长期使用或使用不当的情况下，可能会出现硬盘文件损坏或者出现坏道等问题，影响数据安全和文件操作。这时候，移动硬盘查错工具就派上用场了。它可以帮助用户发现移动硬盘中的问题，并且还可以对移动硬盘进行修复。但是&a…...

编程日记 2023/5/22 17:51:53

javaIO流之缓冲流

目录简介1、字节缓冲流1.1构造方法1.2缓冲流的高效1.3为什么字节缓冲流会这么快？1.4byte & 0xFF 2、字符缓冲流2.1构造方法2.2字符缓冲流特有方法 3、练习简介 Java 的缓冲流是对字节流和字符流的一种封装，通过在内存中开辟缓冲区来提高 I/O 操作…...

编程日记 2023/5/22 17:46:51

定义制造业操作（定义 MES/MOM 系统）

制造业操作包含众多工厂级活动，涉及设备（定义、使用、时间表和维护）、材料（识别、属性、位置和状态）、人员（资格、可用性和时间表），以及这些资源与包含其信息碎片的众多系统之间的互…...

编程日记 2023/5/30 19:29:50

人工智能专栏第二讲——人工智能的基础技术

目录一、机器学习二、深度学习三、自然语言处理四、计算机视觉五、总结在第一讲中，我们介绍了人工智能的概念和发展趋势&#...

编程日记 2023/5/22 17:36:46

注意！ChatGPT的Plus账号也会被封禁

文 / 高扬（微信公众号：量子论） 最近经常看到有人丢个截图，然后悲伤地说，ChatGPT账号被封了。这不是账号被封，而是所用的代理节点被OpenAI封了，换个节点即可。这个截图才是账号真正被封的提示&…...

编程日记 2023/5/22 17:31:45

理解：Public Key Cryptography的应用

Applications Encryption with public key, decryption with private key Confidentiality or secrecy Encryption with private key, decryption with public key Integrity/authentication 一些概念特征的明确： public key：所有人都知道（公…...

编程日记 2023/5/22 17:26:44

深度学习中的图像分类介绍

文章目录深度学习中的图像分类介绍深度学习中的图像分类技术卷积神经网络 (Convolutional Neural Network, CNN)深度残差网络 (Deep Residual Network, ResNet)卷积神经网络的变种图像分类的应用计算机视觉目标检测人脸识别自动驾驶图像搜索视频监控医疗成像疾病分类病灶识别…...

编程日记 2023/5/22 17:21:43

自然语言处理基础

以下所有内容来自《自然语言处理基于预训练模型的方法》 1. 文本的表示利用计算机对自然语言进行处理，首先要解决语言在计算机内部的存储和计算问题。使用字符串表示计算文本的语义信息的时候，往往使用基于规则的方法。如：判断一个句子编…...

编程日记 2023/5/22 17:16:42

低代码与其拓荒，不如颠覆开发行业

目录一、前言二、低代码是一个值得信赖的“黑盒子” 粗略总结，开发者对低代码平台所见即所得设计器有两种反应： 三、人人都爱黑盒子四、用“低代码平台”来开发是什么样的感受？ 五、结论一、前言在科幻电影中，我们看到…...

编程日记 2023/5/30 20:20:56

【数据结构】散列表（哈希表）

文章目录前言一、什么是散列表二、什么是哈希函数三、下面简单介绍几种哈希函数四、冲突处理散列冲突的方法开放定址法再散列函数法公共溢出区法链地址法五、代码实现1.哈希函数2.链表和哈希表的创建3.哈希表初始化3.从哈希表中根据key查找元素4.哈希表插入元素5.元素删除6.哈…...

编程日记 2023/5/22 17:06:39

Flutter 笔记 | Flutter 核心原理（一）架构和生命周期

Flutter 架构简单来讲，Flutter 从上到下可以分为三层：框架层、引擎层和嵌入层，下面我们分别介绍： 1. 框架层 Flutter Framework，即框架层。这是一个纯 Dart实现的 SDK，它实现了一套基础库，自…...

编程日记 2023/5/22 17:01:38

【Linux进阶之路】基本指令(下)

文章目录一. 日志 date指令——查看日期基本语法1基本语法2cal指令——查看日历常见选项二 .find——查找文件常用选项-name显示所有文件显示指定类型的文件三.grep——行文本过滤工具语法常见的用法补充知识——APP与服务器的联系四.打包压缩与解压解包zip与unzipzipunzip…...

编程日记 2023/5/22 16:56:35

Vue--》Vue 3 路由进阶——从基础到高级的完整指南

目录 Vue3中路由讲解与使用路由的安装与使用路由模式的使用编程式路由导航路由传参嵌套路由命名视图重定向与别名 Vue3中路由讲解与使用 Vue 路由是 Vue.js 框架提供的一种机制，它用于管理网页上内容的导航。Vue 路由可以让我们在不刷新页面的情况下…...

编程日记 2023/6/1 7:59:56

【华为OD机试真题】【python】网上商城优惠活动(一)【2022 Q4 | 100分】

华为OD机试- 题目列表 2023Q1 点这里！！ 2023华为OD机试-刷题指南点这里！！题目描述某网上商场举办优惠活动，发布了满减、打折、无门槛3种优惠券，分别为: 1：每满100元优惠10元，无使用数限制，如100~199元可以使用1张减10元，200-299可使用2张减20元，以此类推; 2：…...

编程日记 2023/5/22 16:46:32

【业务数据分析】—— 用户留存分析(以挖掘Aha时刻为例)

目录一、用户留存是什么二、为什么要考虑用户留存 1、为什么要考虑用户留存？ 2、影响用户留存的可能因素 3、用户留存的3个阶段三、怎么进行用户留存分析(挖掘Aha时刻) 1、Aha时刻 2、Aha时刻的作用 3、挖掘Aha时刻一、用户留存是什么在互联网行业中&…...

编程日记 2023/5/22 16:41:31

极客的git常用命令手册

极客的git常用命令手册 1.1 权限配置篇1.1.1 创建ssh key1.1.2 本地存在多个密钥时，如何根据目标平台自动选择用于认证的密钥？ 1.2 基础信息配置篇1.2.1 配置用户名1.2.2 配置用户邮箱1.2.3 设置文件名大小写区分1.2.4 设置命令行显示颜色1.2.5 检查git全…...

编程日记 2023/5/22 16:36:28

spring-data 一统江湖，玩转多种数据源

1、起因因为要在项目中同时访问redis，mongo和mysql三种数据库，而且因为偏向spring-data，所以都使用了spring-data 在使用的过程中如果不做配置发现会有冲突，这篇文章也是解决这个问题，避免以后遇到同样的问题不知所…...

编程日记 2023/5/22 16:31:27

【EMC专题】为什么PCB上的单端阻抗控制在50欧？

每当我们在发板后和PCB板厂沟通说有些走线需要阻抗控制，控制在多少多少。其实我们所说的阻抗是传输线的特性阻抗。特性阻抗是不能用万用表测量出来的，他由传输线的结构以及材料决定，与传输线的长度、信号的幅度、频率等均无关。特性阻抗的概念当电磁波在电缆上…...

编程日记 2023/5/22 16:26:26

想自学写个操作系统，有哪些推荐看的书籍？

前言哈喽，我是子牙，一个很卷的硬核男人。喜欢研究底层，聚焦做那些大家想学没地方学的课程：手写操作系统、手写虚拟机、手写编程语言… 今天我们将站在一个自学者的角度来聊聊如何实现自己的操作系统。并为大家推荐几本能够帮助你…...

编程日记 2023/5/30 3:38:41

无机布防火卷帘门报价透明，包工包料，一次说清所有费用

很多客户在选购无机布防火卷帘门时，最关心实际成交价格，也担心报价不清晰，后期产生各类额外支出。行业内产品定价参差不齐，选材做工不同，最终价位自然存在差距，挑选时不能只看表面低价。 👉 点击…...

编程新知 2026/5/26 4:58:26

T型翼/尾板导向的穿浪双体船姿态控制【附代码】

✨ 长期致力于穿浪双体船、T型翼、尾板、多自由度姿态控制、舒适性评估研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）动态水翼升力模型与耦合运动方…...

编程新知 2026/5/26 4:32:22

AMLP：基于大语言模型的自动化机器学习势函数构建平台

1. 项目概述：当AI遇见原子模拟，AMLP如何重塑机器学习势函数构建在计算材料科学和化学物理领域，分子动力学模拟是我们窥探微观世界动态行为的“显微镜”。无论是研究新材料的相变过程，还是探索生物大分子的折叠机制，其核…...

编程新知 2026/5/26 3:20:00

GitLab External Wiki代理权限绕过漏洞深度解析

1. 这个漏洞不是“修个补丁”就能完事的——它暴露的是 GitLab 权限模型里一个被长期忽视的逻辑断层GitLab 安全漏洞 CVE-2025-2614，光看编号容易误以为是又一个常规的越权或 XSS 类型漏洞。但我在实际复现和审计过程中发现，它根本不是配置疏漏或代码拼写…...

编程新知 2026/5/26 0:42:31

大佬推荐的网络安全学习路线（从基础到高级，超级详细）

大佬推荐的网络安全学习路线（从基础到高级，超级详细） 说起网络安全，你可能会担心它是一个过时的行业。有人说，网络安全快卷死了，你既要攻又要防，并且随着技术的发展，你还要不断地学…...

编程新知 2026/5/25 23:25:14

ZMJS，把 JavaScript 解释器放进 SAP ABAP 应用服务器之后，很多扩展思路会变得不一样

我今天看这个 oisee/zmjs 仓库时，最吸引人的不是它把 JavaScript 语法做进了 ABAP，而是它选择了一条非常 SAP 的路线，纯 ABAP、无外部依赖、无 Kernel Module、以类和接口的形式运行在 SAP 应用服务器内部。仓库自己的定位很直接，ZMJS 是一个面向 SAP ABAP 的 Mini JavaScr…...

编程新知 2026/5/25 21:17:35

利用FTDI芯片MPSSE模式构建Arduino兼容开发环境

1. 项目概述：当FTDI芯片遇上Arduino生态如果你手头有一些闲置的FTDI USB转串口模块，比如常见的FT232R、FT2232H，或者像我一样，从某个旧设备上拆下来一块FT2232C的老古董，除了用来给单片机烧录程序或者做串口调试&#…...

编程新知 2026/5/25 20:07:55

Frida无Root Hook PC微信小程序源码（Electron+Chromium）

1. 这不是“破解”，而是一次对微信小程序运行机制的逆向观察你有没有试过，在PC版微信里点开一个小程序，想看看它背后是怎么写的？比如某个电商小程序的优惠券逻辑、某个工具类小程序的数据渲染方式，甚至只是单纯好奇—…...

编程新知 2026/5/25 17:55:38

DeepSeek安全测试辅助Prompt工程白皮书（含17个CVE靶场验证指令模板）

更多请点击： https://intelliparadigm.com 第一章：DeepSeek安全测试辅助 DeepSeek系列大模型在代码生成、漏洞模式识别与安全上下文理解方面展现出独特优势，可作为安全测试工程师的智能协作者。其对OWASP Top 10、CWE分类体系及常见PoC结构具…...

编程新知 2026/5/25 17:46:23

终极指南：Windows 10完美安装PL2303驱动，解决老旧USB转串口芯片兼容性问题

终极指南：Windows 10完美安装PL2303驱动，解决老旧USB转串口芯片兼容性问题【免费下载链接】pl2303-win10 Windows 10 driver for end-of-life PL-2303 chipsets. 项目地址: https://gitcode.com/gh_mirrors/pl/pl2303-win10 你是否还在为Windows…...

编程新知 2026/5/25 17:44:03

“order by” 是怎么工作的

全字段排序

rowid 排序

联合索引与索引覆盖

相关文章：