当前位置: 首页 > article >正文

MySQL的limit 10 和 limit 1000000 的区别的庖丁解牛

“LIMIT 10和LIMIT 1000000, 10”常被误解为“只是取的数据位置不同”或“无非是多扫描几行”。但本质上它们是两种截然不同的 I/O 消耗模型LIMIT 10是**“浅层扫描”**是数据库最喜欢的操作几乎零成本。LIMIT 1000000, 10深分页是**“深层丢弃”是数据库的噩梦意味着要读取、解析、过滤一百万行数据然后残忍地扔掉前 999,990 行**只留最后 10 行。理解它们的区别就是理解为什么你的网站在数据量大了之后翻页会越来越慢以及如何避免这种“自杀式”的查询。一、核心本质获取 vs 丢弃1. 语义对比语句语义本质动作比喻LIMIT 10取前 10 条读取并返回去图书馆拿起书架上前 10 本书拿走。LIMIT 1000000, 10跳过 100 万条取接下来 10 条读取 过滤 丢弃 返回去图书馆把前 100 万本书全部拿下来翻开看一眼扔回地上直到第 100 万零 1 本才带走。2. 代价分析LIMIT 10MySQL 只需要找到起始点读 10 行结束。工作量 10 行。LIMIT 1000000, 10MySQL 必须找到起始点读1,000,010 行判断每一行是否符合WHERE条件排序如果需要然后丢弃前 100 万行最后返回 10 行。工作量 ≈100 万行。 核心洞察深分页的性能瓶颈不在于“返回的那 10 行”而在于“被丢弃的那 100 万行”。你付了读 100 万行的钱IO/CPU却只拿了 10 行的货。二、执行机制引擎是如何“受苦”的假设表中有 200 万行数据执行SELECT * FROM orders LIMIT 1000000, 10。1. 有索引的情况最好情况即使id有主键索引回表风暴MySQL 先在聚簇索引主键树上定位到第 1,000,001 个节点。但是如果你查询的是SELECT *非覆盖索引MySQL 必须进行回表操作。它需要读取 1,000,010 个主键 ID然后去二级索引或堆中查找对应的完整行数据。随机 I/O这 100 万次回表往往是随机的磁盘读取机械硬盘会直接卡死SSD 也会延迟飙升。排序开销如果带有ORDER BY且无法利用索引排序MySQL 需要在内存或临时文件中对 100 万 数据进行排序Filesort然后再截取。2. 无索引的情况灾难情况全表扫描直接从第一行开始逐行扫描。计数丢弃扫描一行计数器 1直到计数器 1,000,000。结果前 100 万行的扫描完全是无用功但 CPU 和 IO 实打实地被消耗了。 核心洞察LIMIT offset, size的复杂度是O(offsetsize)O(offset size)O(offsetsize)。当 offset 很大时性能线性下降直至超时。三、性能差异数量级的鸿沟让我们看一组典型的基准测试数据假设表数据量 500 万有主键索引查询语句耗时 (平均)扫描行数状态LIMIT 100.001s10⚡ 极速LIMIT 1000, 100.02s1,010 正常LIMIT 100000, 100.5s100,010 缓慢LIMIT 1000000, 105.0s1,000,010超时/锁死LIMIT 4000000, 10Timeout4,000,010☠️服务雪崩注随着 Offset 增大耗时呈线性增长。在并发高的场景下几个这样的查询就能把数据库 CPU 打满导致整个站点不可用。四、灾难场景用户行为引发的雪崩深分页不仅是慢还会引发连锁反应爬虫攻击恶意爬虫专门抓取page10000,page10001… 这种深层页面。数据库瞬间被拖垮。运营误操作运营人员在后台导出数据不小心翻到了第 5000 页直接导致生产库挂掉。长尾效应大部分用户只看前 10 页但只要有 1% 的用户翻到深处系统的平均响应时间就会被拉高拖累所有用户。连接池耗尽深分页查询执行时间长占用数据库连接的时间变长。高并发下连接池迅速被占满新请求无法获取连接导致应用层报错502/504。五、优化方案如何拯救深分页既然LIMIT offset, n有原罪我们该如何解决方案 1禁止深层翻页产品层面策略限制最大页码。例如只允许翻看前 100 页1000 条数据。理由真实用户极少会翻看第 1000 页以后的数据。如果需要找特定数据请使用搜索功能而不是翻页。话术“为了您的体验仅展示前 100 页结果请细化搜索条件。”方案 2游标法 / 延迟关联 (Seek Method / Deferred Join) ——最推荐利用上一页最后的 ID 作为起点避免扫描前面的数据。原理WHERE id last_seen_id LIMIT 10。SQL 改写-- 原始慢查询SELECT*FROMordersORDERBYidLIMIT1000000,10;-- 优化后 (假设上一页最后一条 ID 是 1000000)SELECT*FROMordersWHEREid1000000ORDERBYidLIMIT10;优势无论偏移到多少永远只扫描 10 行利用主键索引跳跃。性能恒定与数据量无关。缺点只能连续翻页不能直接跳转到任意页码但在互联网产品中连续翻页是主流。进阶版延迟关联如果必须用 offset先查 ID再回表。SELECTt1.*FROMorders t1INNERJOIN(SELECTidFROMordersORDERBYidLIMIT1000000,10)t2ONt1.idt2.id;原理子查询只查id覆盖索引无需回表速度极快。拿到 10 个 ID 后再通过JOIN回表查详细数据。将 100 万次随机 IO 减少为 10 次。方案 3搜索引擎替代 (Elasticsearch)场景复杂的筛选、排序、深分页需求。策略将数据同步到 ES。优势ES 的search_after机制天然支持高性能深分页且擅长全文检索。注意ES 也有深分页限制默认 10000同样推荐使用search_after而非from size。方案 4业务折中记录上下文策略不在 URL 传pagexxx而是传last_idxxx。体验用户点击“下一页”后端自动带上当前页最大 ID 去查下一条。对用户透明对数据库友好。六、架构启示设计时的“防呆”策略默认禁止大 Offset在代码层或 DB 中间件层做拦截当offset 10000时直接抛出异常或返回空防止误操作。强制使用主键排序深分页必须依赖有序的唯一索引通常是主键否则无法使用游标法。读写分离将深分页查询强制路由到从库避免拖垮主库的交易性能。缓存热点页前 10 页的数据变化频繁但访问极高可以缓存深层页面访问低可以直接查库反正也没人看或者缓存时间设长一点。 总结LIMIT深浅之争全景图维度LIMIT 10LIMIT 1000000, 10本质精准获取大量丢弃复杂度O(1)O(1)O(1)(常数级)O(N)O(N)O(N)(线性级N 为 offset)IO 类型少量随机/顺序 IO海量随机 IO (回表)性能毫秒级秒级甚至超时风险无拖垮数据库引发雪崩最优解直接使用游标法 (Where ID ?)终极心法LIMIT的偏移量是数据库的“毒性指标”。偏移量越大毒性越强。理解它们就是理解“不要让用户为数据库的无能买单”也不要让数据库为用户的随意翻页送命。记住没有免费的午餐每一行被丢弃的数据都是真金白银的 IO 资源。于索引中见捷径于游标中见智慧以限制为盾以搜索为矛于海量数据中求性能之真。最好的分页是让用户感觉不到分页的存在却让数据库始终轻盈如燕。行动指令给开发者/DBA审计慢查询立刻检查 Slow Query Log找出所有offset大于 1000 的 SQL。改造接口将前端分页参数从page/no改为cursor/id模式如果是无限滚动加载。添加保护在 DAO 层或 MyBatis/Hibernate 拦截器中设置max_offset 5000超过直接报错。优化现有 SQL对无法修改业务的深分页尝试改写为“延迟关联”写法。引入 ES如果业务强依赖复杂条件的深分页尽快将查询迁移到 Elasticsearch。教育产品告诉产品经理让用户翻到第 1000 页是反人类的设计引导他们使用搜索。监控报警对执行时间超过 1 秒的分页查询设置报警。这就是 MySQLLIMIT深浅分页于偏移中见代价于游标中见生机以索引为路避全表之坑于数据海洋中求极速之真。最后送你一句话“数据库不懂人类的耐心它只会忠实地执行你的愚蠢。别让那 100 万次的丢弃成为压垮系统的最后一根稻草。用游标代替偏移用智慧代替暴力让每一次翻页都轻如鸿毛。”

相关文章:

MySQL的limit 10 和 limit 1000000 的区别的庖丁解牛

“LIMIT 10"和"LIMIT 1000000, 10”,常被误解为“只是取的数据位置不同”或“无非是多扫描几行”。 但本质上,它们是两种截然不同的 I/O 消耗模型: LIMIT 10 是**“浅层扫描”**,是数据库最喜欢的操作,几乎零…...

mysql 回表、索引覆盖、索引下推的庖丁解牛

这三个概念常被误解为“晦涩的底层术语”或“只有 DBA 才需要关心的细节”。 但本质上,它们是MySQL 优化器在“减少磁盘 I/O"和“减少 CPU 计算”这两大核心目标上,进化出的三种生存智慧。 回表 (Table Lookup):是代价,是不得…...

Spring AOP 进阶:揭秘 @annotation 参数绑定的底层逻辑

Spring AOP 进阶:揭秘 annotation 参数绑定的底层逻辑 在使用 Spring AOP 开发自定义注解(如 RateLimit)时,我们经常会看到这样一种“神奇”的写法: Around("annotation(rateLimit)") public Object checkLi…...

用 autoresearch 优化万物

Karpathy的推文在一个周五晚上发布。一个链接,一条损失曲线向下复合的截图,一句话:代理在你睡觉时做实验。 我在十分钟内读完了README。然后我又读了一遍。不是因为代码复杂——它特意只有630行。我再读一遍是因为代码不是重点。 要点在于约…...

2026怎么选猫粮?实测揭秘世界十大顶级猫粮品牌希喂怎么样

换粮对于养猫的朋友来说,是最大的一个大难题。每次挑猫粮的时候,都小心翼翼的,生怕选错了,误选到毒猫粮;可是不换粮,有会因为摄入的营养过于单一导致营养不良。2026怎么选猫粮?这几年&#xff0…...

LA04-Abaqus嵌合体退火仿真案例教程:完全热力耦合分析的实践与解析

LA04-Abaqus嵌合体退火热力耦合仿真案例教程 在Abaqus中创建304钢-铜缝-304钢焊接的2D平板模型,赋予密度、弹性参数、热导率、比热容和线膨胀系数后,给定梯度变化温度载荷曲线,对装配体进行退火模拟的完全热力耦合分析,输出温度场…...

TransXNet:结合局部与全局注意力,实现高效感受野与强大归纳偏差的‘Dual Dynam...

TransXNet:结合局部和全局注意力提供强大的归纳偏差和高效感受野 ViTs 具有归纳偏差,后面大部分工作都选择构建了混合网络,如 PVT 等,即融合了自注意力和卷积操作。 然而,由于标准卷积在这些混合网络中的使用&#xff…...

基于P-Q分解法的电力系统潮流计算:理论与实践相结合的全面解析

基于P-Q分解法的电力系统潮流计算 设计内容 1.掌握PQ分解法求解潮流的基本原理及过程 2.比较PQ分解法与NR法的区别 包含代码加报告,内容全面,代码流畅 ID:9939761235232992走马街秀气的深海鲨电力系统潮流计算里有个特别省事儿的算法,江湖人称…...

无感定位与轨迹建模融合的仓储空间透明化管理技术路径

《无感定位与轨迹建模融合的仓储空间透明化管理技术路径》副标题:基于 Pixel-to-Space 的空间感知与流程认知一体化实现方法发布单位:镜像视界(浙江)科技有限公司一、引言:从“看见仓储”到“理解仓储”在当前仓储数字…...

高频方波电压注入IPMSM无感控制算法Simulink仿真调试与实际应用探索

基于高频方波电压注入零低速IPMSM无感控制算法simulink仿真模型 ①在估计的d轴注入高频方波电压来估计转子位置,具有较高的稳态精度和动态性能。 该仿真调试效果不错,曾应用到实际电机中去。 ②阐述了 IPMSM 的 MTPA 控制原理,并在此基础上研…...

Comsol光学仿真模型:纳米球/柱Mie散射多级分解

Comsol光学仿真模型:包括纳米球/柱 Mie散射多级分解在COMSOL里折腾纳米颗粒的光学响应总让我想起小时候拆收音机的经历——表面看起来是个简单的金属疙瘩,内部却藏着复杂的电磁场舞蹈。这次咱们重点聊怎么用多级分解的手法,把纳米球和纳米柱的…...

UG CAM加工二次开发,型腔铣CAVITY_MILL设置 切削参数-刀路方向 向内、向外API方法

/*这里operTag为一个工序操作,可以是已经创建好的操作,也可以是新创建的操作*/ tag_t operTag;//设置切削刀路方向:向内-向外 UF_PARAM_set_int_value (operTag, UF_PARAM_CUT_FOLLOW_PROGRESSION, UF_PARAM_cut_follow_progression_inward)…...

模板方法模式:复杂业务代码的解耦与复用之道

在经典的 DAO - Service (业务层) - Controller 三层架构中,模板方法模式(Template Method Pattern) 的最佳落地位置通常是 Service 层(抽象基类)。 为什么放在 Service 层? Controller 层太薄:…...

RAGFlow安装部署使用

RAGFlow安装部署使用教程 前言 在大模型应用越来越普及的今天,很多人都想要搭建属于自己的私有知识库,把公司的文档、个人的资料都变成可以对话的智能助手,但是又担心数据泄露,或是被复杂的部署流程劝退。 如果你也有这样的困扰…...

Python 数据可视化(二):多曲线对比、局部放大框(附源码)

在上一篇博客中,我们成功配置了所向披靡的 VS Code Conda 数据可视化环境。环境有了,画笔就位了,今天我们就来动真格的——手把手写代码,把数据变成能放进报告或论文的高清图!步骤 0:画图前的准备——什么…...

eDiary使用教程

eDiary使用教程CSDN文章 前言 在信息爆炸的今天,我们每天都有太多的思绪、工作笔记、生活点滴需要记录,却又担心隐私泄露,或是被臃肿的笔记软件拖慢效率。如果你也在寻找一款轻量、安全、无广告的本地记录工具,那么eDiary 电子日…...

GitHub霸榜!OpenHands开源炸裂:全能AI程序员真的来了?

阅读指引:这是一篇旨在打破“AI只会写Hello World”刻板印象的深度硬核测评。本文不仅是对OpenHands这一现象级开源项目的拆解,更是对未来软件工程形态的一次前瞻性推演。全文约 3500 字,阅读需 8 分钟,建议收藏后细读。00. 序章&…...

六大AI论文网站助力学术写作,提供智能降重与自然改写功能,减少重复率

开头总结工具对比(技能4) �� 为帮助学生们快速选出最适合的AI论文工具,我从处理速度、降重效果和核心优势三个维度,对比了6款热门网站,数据基于实际使用案例: 工具名称 处理速度 降…...

计算机毕业设计springboot停车场管理系统 基于SpringBoot框架的智能车库运营平台设计与实现 智慧停车服务系统——采用SpringBoot技术的车辆停放信息化解决方案

计算机毕业设计springboot停车场管理系统4z3jk9 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。 二十一世纪以来,随着城市化进程加速和机动车保有量持续增长&#x…...

SM3 vs SHA-256:国密哈希算法与主流算法的性能对比测试(附Benchmark数据)

SM3与SHA-256深度性能评测:如何选择适合业务的哈希算法? 在数据安全领域,哈希算法如同数字世界的指纹采集器,将任意长度的数据映射为固定长度的"指纹"。当国密标准SM3遇上国际主流SHA-256,开发者该如何选择&…...

计算机毕业设计springboot基于web的英语学习网站 基于SpringBoot的在线英语教育平台设计与实现 基于B/S架构的智能英语学习系统开发

计算机毕业设计springboot基于web的英语学习网站 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着全球化进程加速和国际交流日益频繁,英语作为国际通用语言的重要…...

仿生软体机器人实战:从蝠鲼游泳到管道爬行,5个惊艳案例解析

仿生软体机器人实战:从蝠鲼游泳到管道爬行,5个惊艳案例解析 当工程师们开始向自然界寻找灵感时,机器人技术便进入了一个全新的维度。想象一下,一条能在珊瑚礁间灵活穿梭的机械蝠鲼,或是在复杂管道系统中自如爬行的软体…...

孪生神经网络在变化检测中的应用:从CSCDNet到SSCDNet的演进与优化

孪生神经网络在语义场景变化检测中的技术演进与实践 当城市街景随时间流转,建筑物翻新或道路扩建时,如何让计算机像人类一样敏锐地捕捉这些变化?孪生神经网络正成为解决这一挑战的核心技术。不同于传统像素对比方法容易受光照、视角干扰&…...

MCP协议在VS Code中的高阶应用(2024企业级开发必掌握的4种动态上下文集成模式)

第一章:MCP协议核心机制与VS Code扩展生态全景图MCP(Model Communication Protocol)是一种面向大模型智能体协同的轻量级通信协议,其设计目标是在异构开发环境间建立标准化、可插拔的模型调用与状态同步通道。协议采用基于 JSON-R…...

为什么有的降AI工具降完还是高?深度分析工具选择的关键指标

为什么有的降AI工具降完还是高?深度分析工具选择的关键指标 花了钱、用了工具、等了半天,结果知网一查AI率还是45%。这种事我身边不止一个人遇到过。降AI工具效果差的原因可能有很多,但最关键的问题往往出在工具选择上。选对了工具&#xff…...

计算机毕业设计springboot遇见宠物生活馆系统设计与实现 基于SpringBoot的萌宠驿站综合服务管理平台设计与实现 SpringBoot框架下爱宠家园一站式服务平台的设计与实现

计算机毕业设计springboot遇见宠物生活馆系统设计与实现n6ea5118 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着社会经济的持续发展和居民生活水平的不断提升,饲…...

智慧仓储空间智能管理系统技术方案:基于三维重构与轨迹建模的全流程透明化与智能决策体系

《智慧仓储空间智能管理系统技术方案》副标题:基于三维重构与轨迹建模的全流程透明化与智能决策体系发布单位:镜像视界(浙江)科技有限公司一、项目背景:仓储管理正在从“经验驱动”走向“空间智能驱动”随着仓储规模的…...

重塑社区体验:打造无广告干扰的第三方酷安客户端

重塑社区体验:打造无广告干扰的第三方酷安客户端 【免费下载链接】c001apk fake coolapk 项目地址: https://gitcode.com/gh_mirrors/c0/c001apk c001apk作为一款基于官方客户端二次开发的第三方应用,采用Jetpack Compose框架与MVI架构模式&#…...

【2026 最新】一篇文章告诉你什么是Skills 同时 告别Prompt工程!用Claude Skills把AI变成你的专属打工人

在人工智能领域,尤其是在 AI 智能体(AI Agent)的语境下,Skills (技能)是一个核心概念。简单来说,它是让 AI 从“会思考”的聊天机器人,进化为“会做事”的数字助理的关键。 你可以把它理解为 A…...

2026.3.20 用EasyExcel实现excel报表的导入与导出

2026.3.20 用EasyExcel实现excel报表的导入与导出1.在自己模块创建一个实体类Datapublic class User {/*** value表示该属性对应的表头名称, index表示该属性所处的列的位置*///该注解能建立Java对象与表格列之间的映射关系ExcelProperty(value "编号", …...