从63 秒到 0.482 秒:深入剖析 MySQL 分页查询优化
在日常开发中,数据库查询性能问题就像潜伏的“地雷”,总在高并发或数据量庞大的场景下引爆。尤其是当你运行一条简单的分页查询时,结果却让用户苦苦等待,甚至拖垮了系统。这种情况你是否遇到过?
你可能会想:“我的表已经建立了索引,为什么还是这么慢?” 或者:“难道数据库引擎就没办法高效处理大数据分页吗?”
这篇博客将从 MySQL 索引机制入手,深入剖析其底层原理(B+树),结合实际场景讲解分页查询优化的技巧,并通过实验数据展示优化效果。只需稍加调整,就能让查询从 几十秒 缩短到 几百毫秒!
1. MySQL 索引机制
1.1 索引是什么?
索引是一种提高查询速度的数据结构。它的作用类似于书的目录,可以帮助 MySQL 快速找到目标数据,而不是逐页翻找。
1.2 MySQL 的索引类型
-
聚簇索引(Clustered Index):
- InnoDB 存储引擎默认的主键索引。
- 特点:数据和索引存储在一起,叶子节点存储的是完整行的数据。
- 每个表只能有一个聚簇索引。
- 示例:假设一张用户表以
id为主键,索引结构如下:根节点 → 中间节点 → 叶子节点(存储完整行数据)
-
辅助索引(Secondary Index):
- 除主键外的其他索引,例如普通索引和唯一索引。
- 特点:叶子节点存储的是主键值,通过主键值回表查询完整数据。
- 适用场景:用于加速非主键列的查询。
1.3 MySQL 缓存机制的变化
-
MySQL 8.0 删除了查询缓存(Query Cache):
- 原因:查询缓存频繁失效,影响性能,在高并发写场景下尤为明显。
- 查询缓存的替代:更高效的优化器和 InnoDB 缓存机制。
-
MySQL 的 Buffer Pool:
- 依旧是核心性能优化手段。
- 功能:将数据页、索引页缓存到内存中,减少磁盘 I/O。
- 特点:即使查询缓存被删除,Buffer Pool 仍然支持高效的索引查询和数据读取。
2. 索引的底层原理
2.1 什么是 B+树?
B+树是一种平衡多路搜索树,广泛应用于数据库和文件系统中,用于存储索引。
2.2 B+树的结构
- 非叶子节点:
- 只存储索引键,起到导航作用。
- 减少了节点大小,提高了节点的分支因子。
- 叶子节点:
- 存储所有实际数据(聚簇索引)或主键值(辅助索引)。
- 通过链表指针串联,便于范围查询。
2.3 B+树的特点
- 平衡性:所有叶子节点都在同一层,查询效率稳定。
- 磁盘友好:每个节点存储多个索引键,减少了磁盘 I/O 次数。
- 范围查询高效:叶子节点的链表结构支持顺序遍历。

2.4 为什么 MySQL 使用 B+树?
- 相比 B 树:B+树的非叶子节点存储更多的索引键,更适合大规模数据存储。
- 相比哈希索引:B+树支持范围查询和排序,而哈希索引只支持等值查询。
3. 优化 SQL 排序分页查询的场景
3.1 问题描述
假设我们需要从 content 表中查询最近的第 2000000 条到第 2000010 条数据:
SELECT * FROM content ORDER BY create_time DESC LIMIT 2000000, 10;
3.2 存在的问题
-
大偏移量(OFFSET):
- 数据库需要扫描并丢弃前 2000000 条记录,浪费资源。
- 即使有索引,MySQL 仍需逐一读取和排序这些记录。
-
全表扫描的风险:
- 如果
create_time没有索引,查询会触发全表扫描。
- 如果
3.3 优化思路
- 利用子查询限定范围:
- 子查询通过索引直接定位目标主键范围。
- 主表查询通过主键精确匹配记录,减少无效扫描。
3.4 优化前后对比
优化前 SQL:
SELECT * FROM content ORDER BY create_time DESC LIMIT 2000000, 10;
优化后 SQL:
SELECT *
FROM content
INNER JOIN (SELECT id FROM content ORDER BY create_time DESC LIMIT 2000000, 10
) temp_content
ON content.id = temp_content.id;
3.5 优化前后性能数据
- 优化前:
- 查询耗时:63s
- 原因:扫描大量数据并丢弃前 2000000 条记录,逻辑开销大。
- 优化后:
- 查询耗时:0.482s
- 原因:子查询通过索引快速定位目标记录范围,主表只查询需要的数据。
4. 为什么优化后性能提升显著?
4.1 子查询利用索引
- 子查询
SELECT id FROM content ORDER BY create_time DESC LIMIT 2000000, 10利用了create_time索引。 - 索引通过 B+树快速定位到目标范围,减少了全表扫描。
4.2 减少了无效的数据处理
- 优化前:扫描并丢弃了 2000000 条数据。
- 优化后:只查询需要的数据。
4.3 高效利用缓存
- 优化后的查询范围更小,Buffer Pool 的命中率更高。
- 避免了大范围扫描导致的缓存失效问题。
4.4 排序开销显著降低
- 子查询已经完成排序,主查询不需要重复排序,节省了计算资源。
相关文章:
从63 秒到 0.482 秒:深入剖析 MySQL 分页查询优化
在日常开发中,数据库查询性能问题就像潜伏的“地雷”,总在高并发或数据量庞大的场景下引爆。尤其是当你运行一条简单的分页查询时,结果却让用户苦苦等待,甚至拖垮了系统。这种情况你是否遇到过? 你可能会想࿱…...
细说机器学习算法之过拟合与欠拟合
系列文章目录 第一章:Pyhton机器学习算法之KNN 第二章:Pyhton机器学习算法之K—Means 第三章:Pyhton机器学习算法之随机森林 第四章:Pyhton机器学习算法之线性回归 第五章:Pyhton机器学习算法之有监督学习与无监督…...
C/C++ 虚函数
虚函数的定义 虚函数是指在基类内部声明的成员函数前面添加关键字 virtual 指明的函数虚函数存在的意义是为了实现多态,让派生类能够重写(override)其基类的成员函数派生类重写基类的虚函数时,可以添加 virtual 关键字,但不是必须这么做虚函…...
【3GPP】【5G】注销流程(Deregistration procedures)
1. 欢迎大家订阅和关注,精讲3GPP通信协议(2G/3G/4G/5G/IMS)知识点,专栏会持续更新中.....敬请期待! 目录 3.1.2 Deregistration procedures 3.1.2.1 UE-initiated Deregistration 3.1.2.2 Network-initiated Deregistration 3.1.2 Deregistration procedures 注销流程…...
【小游戏篇】三子棋游戏
硬控我一上午,小编还是太菜了,大家可以自行升级电脑难度,也可以升级游戏到五子棋 1.game.h #pragma once #include<stdio.h> #include<stdlib.h> #include<time.h> #define ROW 3 #define COL 3//初始化棋盘 void InitBoa…...
7-Zip Mark-of-the-Web绕过漏洞复现(CVE-2025-0411)
免责申明: 本文所描述的漏洞及其复现步骤仅供网络安全研究与教育目的使用。任何人不得将本文提供的信息用于非法目的或未经授权的系统测试。作者不对任何由于使用本文信息而导致的直接或间接损害承担责任。如涉及侵权,请及时与我们联系,我们将尽快处理并删除相关内容。 0x0…...
2025年国产化推进.NET跨平台应用框架推荐
2025年国产化推进.NET跨平台应用框架推荐 1. .NET MAUI NET MAUI是一个开源、免费(MIT License)的跨平台框架(支持Android、iOS、macOS 和 Windows多平台运行),是 Xamarin.Forms 的进化版,从移动场景扩展到…...
关于ARM和汇编语言
一图流 ARM 计算机组成 输入设备 输出设备 存储设备 运算器 控制器 处理器读取内存程序执行的过程 取指阶段:控制器器通过地址总线向存储器发送想要获取的指令的地址编号,存储器将指定的指令发送给处理器 译码阶段:控制器对指令进行分…...
2024人工智能AI+制造业应用落地研究报告汇总PDF洞察(附原数据表)
原文链接: https://tecdat.cn/?p39068 本报告合集洞察深入剖析当前技术应用的现状,关键技术 创新方向,以及行业应用的具体情况,通过制造业具体场景的典型 案例揭示人工智能如何助力制造业研发设计、生产制造、运营管理 和产品服…...
QTableView和QTableWidget的关系与区别
QTableView 和 QTableWidget 都是 Qt 框架中用于显示表格数据的控件,但它们在设计和使用上有一些重要的区别。 QTableView 模型-视图架构:QTableView 是 Qt 模型-视图架构的一部分,它与模型(如 QStandardItemModel 或自定义的 QA…...
Java导出通过Word模板导出docx文件并通过QQ邮箱发送
一、创建Word模板 {{company}}{{Date}}服务器运行情况报告一、服务器:总告警次数:{{ServerTotal}} 服务器IP:{{IPA}},总共告警次数:{{ServerATotal}} 服务器IP:{{IPB}},总共告警次数:{{ServerBTotal}} 服务器IP:{{IPC}}&#x…...
ESP8266 MQTT服务器+阿里云
MQTT私有平台搭建(EMQX 阿里云) 阿里云服务器 EMQX 搭建私有MQTT平台 1、搜索EMQX开源版本 2、查看各版本EMQX支持的UBUNTU版本 3、查看服务器Ubuntu版本 4、使用APT安装模式 5、按照官网指示安装并启动 6、下载安装MQTTX测试工具 7、设置云服务…...
css动画水球图
由于echarts水球图动画会导致ios卡顿,所以纯css模拟 展示效果 组件 <template><div class"water-box"><div class"water"><div class"progress" :style"{ --newProgress: newProgress % }"><…...
【设计模式-行为型】状态模式
一、什么是状态模式 什么是状态模式呢,这里我举一个例子来说明,在自动挡汽车中,挡位的切换是根据驾驶条件(如车速、油门踏板位置、刹车状态等)自动完成的。这种自动切换挡位的过程可以很好地用状态模式来描述。状态模式…...
2024.1.22 安全周报
政策/标准/指南最新动态 01 工信部印发《关于加强互联网数据中心客户数据安全保护的通知》 原文: https://www.secrss.com/articles/74673 互联网数据中心作为新一代信息基础设施,承载着千行百业的海量客户数据,是关系国民经济命脉的重要战略资源。…...
idea修改模块名导致程序编译出错
本文简单描述分别用Idea菜单、pom.xml文件管理项目模块module 踩过的坑: 通过idea菜单创建模块,并用idea菜单修改模块名,结构程序编译报错,出错的代码莫名奇妙。双击maven弹窗clean时,还是报错。因为模块是新建的&am…...
root用户Linux银河麒麟服务器安装vnc服务
安装必要桌面环境组件 yum install mate-session-manager -y mate-session #确定是否安装成功安装vnc服务器 yum install tigervnc-server -y切换到root为root得vnc设置密码 su root vncpasswd给root用户设置vnc服务器文件 vi /etc/systemd/system/vncserver:1.service [Un…...
CentOS 7使用RPM安装MySQL
MySQL是一个开源的关系型数据库管理系统(RDBMS),允许用户高效地存储、管理和检索数据。它被广泛用于各种应用,从小型的web应用到大型企业解决方案。 MySQL提供了丰富的功能,包括支持多个存储引擎、事务能力、数据完整…...
OpenCV imread函数读取图像__实例详解
OpenCV imread函数读取图像__实例详解 本文目录: 零、时光宝盒 一、imread函数定义 二、imread函数支持的文件格式 三、imread函数flags参数详解 (3.1)、Flags-1时,样返回加载的图像(使用alpha通道,否…...
激光线扫相机无2D图像的标定方案
方案一:基于运动控制平台的标定 适用场景:若激光线扫相机安装在可控运动平台(如机械臂、平移台、旋转台)上,且平台的运动精度已知(例如通过编码器或高精度步进电机控制)。 步骤: 标…...
DevExpress 2020.1中文汉化保姆级教程:从注册到配置全流程详解
DevExpress 2020.1中文汉化全流程实战指南:从零开始打造本地化开发环境 在软件开发领域,DevExpress作为一套功能强大的.NET控件库,因其丰富的UI组件和高效的数据可视化能力而广受开发者青睐。然而对于非英语母语的开发者而言,面对…...
不止是IDEA!手把手教你用同一个Docker Compose文件部署全家桶(PyCharm/GoLand/DataGrip)
云端开发革命:用Docker Compose统一部署JetBrains全系Web IDE 1. 为什么需要云端IDE全家桶? 记得去年接手一个跨语言项目时,我的本地开发环境简直成了灾难现场——同时开着PyCharm处理Python数据分析、GoLand编写微服务、DataGrip管理数据库&…...
帆软FineDB数据库驱动上传权限配置与实战指南
1. 为什么需要配置数据库驱动上传权限 在企业级报表开发中,经常会遇到需要连接特殊数据库的场景。帆软报表平台默认只内置了常见数据库的驱动,比如MySQL、Oracle这些。但实际项目中,我们可能需要连接达梦、GBase这些国产数据库,或…...
RMBG-2.0镜像免配置部署:无需配置Python环境,开箱即用Web交互界面
RMBG-2.0镜像免配置部署:无需配置Python环境,开箱即用Web交互界面 你是不是也遇到过这样的烦恼?想用AI模型给图片换个背景,结果光是安装Python环境、配置依赖库就折腾了大半天,最后还可能因为版本冲突、CUDA不兼容等问…...
2026做GEO,豆包、DeepSeek、元宝都爱引用哪些媒体?这份清单收好了!
你是不是也发现了这个 “诡异” 的现象?过去,我们拼命讨好搜索引擎的爬虫,优化关键词密度、买外链,只为排在百度搜索结果的第一页。而现在,用户变了。他们不再在搜索框里试错关键词,而是直接打开豆包、Deep…...
阿里达摩院GTE中文向量模型效果展示:中文方言书面语语义对齐能力验证
阿里达摩院GTE中文向量模型效果展示:中文方言书面语语义对齐能力验证 1. 模型核心能力概览 GTE (General Text Embeddings) 是阿里达摩院推出的通用文本向量模型,专门针对中文场景深度优化。这个模型最大的特点是将文本转换为高质量的1024维向量表示&a…...
猫抓插件:浏览器资源嗅探的革命性解决方案
猫抓插件:浏览器资源嗅探的革命性解决方案 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 你是否曾在浏览网页时,看到心仪的…...
EmbeddingGemma-300m部署指南:Ollama镜像+Prometheus监控+日志追踪一体化
EmbeddingGemma-300m部署指南:Ollama镜像Prometheus监控日志追踪一体化 想快速搭建一个功能强大、易于管理的文本向量化服务吗?EmbeddingGemma-300m作为谷歌推出的轻量级嵌入模型,凭借其3亿参数和出色的性能,是构建本地语义搜索、…...
WSL+VSCode+Jupyter+R配置总结(2026年)
题记:网上相关的资料很多了,现阶段跟随AI也能少走很多弯路,但体验下来依旧有些细节没有被很好的提及,故写本文一方面作为自己的备忘录,一方面希望帮助更多像我一样的新手。 用了上述的配置跑了scanpy一年多了…...
Spring AI 流式输出底层原理解析
在 AI 应用开发中,流式输出早已成为提升用户体验的核心能力——像 ChatGPT 那样的打字机式实时回复,既能避免用户长时间干等,又能解决长连接超时问题,是 AI 产品的必备特性。 一、流式输出的两种技术,不是对立而是“底…...
