当前位置: 首页 > article >正文

SQL出现filesort 一定慢吗

前言filesort 出现在当无法使用索引排序时MySQL 必须自己计算排序顺序这个过程称为filesort。EXPLAIN的Extra字段会出现Using filesort。常见触发场景排序列不在索引中或顺序/方向与索引不一致ORDER BY包含RAND()等函数跨表排序如JOIN后对非驱动表的列排序查询范围过大如WHERE条件不能有效缩小索引前缀匹配一、filesort 的内部原理1.filesort 的核心步骤根据WHERE条件筛选数据行。为每一行构造一个排序键sort key包括排序列以及查询需要的其他列。对排序键进行排序。按排序后的顺序返回最终结果。依据内存和配置的不同filesort 有两种算法2.双路排序Two-pass / Old algorithm过程只将排序列和行的主键或行指针放入排序缓冲区sort_buffer_size。排序完成后再根据主键回表读取需要的全部列。适用当排序列 主键的总大小较大或待排数据量较大且max_length_for_sort_data较小时。特点对内存需求小但需要两次访问表排序后回表产生更多随机 I/O。3.单路排序Single-pass / New algorithm过程将排序列和查询所需的所有列都放入排序缓冲区。排序完成后直接得到全部数据无需回表。适用当排序缓冲区足够大且每行的总长度小于max_length_for_sort_data时。特点避免回表但内存压力大若缓冲区放不下会分割成多个块并写入临时文件再进行归并。4.切换控制变量sort_buffer_size排序缓冲区大小线程级别。max_length_for_sort_data当单行总长度超过此阈值时MySQL 会采用双路排序。默认值通常为 1024 字节。单路排序并不绝对优于双路排序。如果sort_buffer_size太小单路排序会频繁生成磁盘临时文件性能反而不如双路。2.filesort 的完整执行流程读取数据根据WHERE条件利用索引或全表扫描收集待排序行。构建排序键单路模式键 排序列 SELECT 中所有列含表达式等。双路模式键 排序列 行 ID如 InnoDB 的主键或 ROWID。内存排序在sort_buffer_size内尝试使用快速排序quicksort排序。磁盘归并若内存放不下将排序块写入临时文件Using temporary files然后对多个文件进行归并排序。返回结果双路模式按排序后的行 ID 依次回表读取剩余列。单路模式直接输出缓冲区中的数据。二、如何避免 filesort建立正确的索引让ORDER BY的列成为某个索引的一部分且顺序、方向一致。注意WHERE条件中的等值查询可以充当索引前缀。避免ORDER BY不同方向如ASC,DESC混用除非 MySQL 8.0 支持降序索引。优化查询本身只取必要的列减小单行长度促使使用单路排序或覆盖索引。当ORDER BY与非覆盖索引的WHERE条件冲突时可尝试重写查询。调整系统参数增加sort_buffer_size但需注意这是线程级内存过高会耗尽全局资源。适当提高max_length_for_sort_data让更多场景使用单路排序但要观察内存压力。设置max_sort_file_size限制磁盘临时文件大小。使用覆盖索引如果索引包含了所有查询需要的列ORDER BY可直接走索引排序并返回没有filesort也没有回表。三、filesort 快慢与优化建议filesort不一定慢如果排序数据能完全在sort_buffer_size内存中完成速度很快通常比索引排序略慢但差异不大。慢的情况当排序数据量超出sort_buffer_size需要生成磁盘临时文件并做归并排序时会伴随大量磁盘 I/O此时filesort会显著变慢。是否需要优化视查询性能而定。如果EXPLAIN显示Using filesort但查询响应时间可以接受不必过度优化只有当你观察到排序成为瓶颈慢查询日志、高Sort_merge_passes状态变量时才需要针对性优化。1.如何判断 filesort 是否慢执行查询后查看状态变量SHOW SESSION STATUS LIKE Sort%;Sort_merge_passes 0 → 表示使用了磁盘临时文件归并性能较差。Sort_range/Sort_rows等可看排序行数。如果Sort_merge_passes长期为 0说明filesort完全在内存完成速度足够快不需要优化2.单路 vs 双路需要优化吗不需要直接“优化”算法本身因为 MySQL 会自动选择合适的算法但可以通过调整系统参数来影响算法的选择进而提升排序性能。参数作用优化建议sort_buffer_size排序缓冲区大小线程级适当调大如 2M~16M可以减少磁盘归并让更多排序在内存完成。过高会浪费内存甚至导致 OOM。max_length_for_sort_data单路排序的行总长度阈值如果查询需要很多列且内存充足可适当提高如 4096 字节让 MySQL 优先使用单路排序避免回表。3.单路与双路的选择逻辑当每行排序键 所需列的总长度 ≤max_length_for_sort_data→ 使用单路一次排序出所有列不回表。否则 → 使用双路只排序列 行指针排序后回表。优化原则若单行数据很长如 TEXT/BLOB 列双路反而更优内存压力小。若回表代价高随机 I/O 严重且内存充足可以提高阈值强制使用单路。一般保持默认值即可只有当 profiling 显示大量回表或磁盘排序时才调整。四、常见误区与检查方法误区“filesort 一定会用磁盘文件”事实只要数据能放入sort_buffer_sizefilesort 完全在内存完成EXPLAIN仍然显示Using filesort。检查方法通过EXPLAIN查看Extra列开启优化器追踪optimizer_trace可看到是否使用索引排序观察SHOW STATUS中的Sort_merge_passes非零表示使用了磁盘归并。总结优化优先顺序首选用索引避免 filesort这是性能最佳的方案彻底消除排序开销。次选接受内存 filesort如果无法索引排序但Sort_merge_passes0说明全部在内存完成性能尚可不优化。最后调参缓解磁盘 filesort如果Sort_merge_passes 0按顺序尝试增加sort_buffer_size减少归并次数调整max_length_for_sort_data让单路/双路更适合你的场景减小结果集WHERE更精确LIMIT提前截断以上均为个人观点以上均为个人观点以上均为个人观点

相关文章:

SQL出现filesort 一定慢吗

前言:filesort 出现在当无法使用索引排序时,MySQL 必须自己计算排序顺序,这个过程称为 filesort。EXPLAIN 的 Extra 字段会出现 Using filesort。常见触发场景:排序列不在索引中,或顺序/方向与索引不一致ORDER BY 包含…...

Rust技术周刊 2026年第16周

阅读原文: https://mp.weixin.qq.com/s/9en-gxsNB544aG6hgkwJVQ 本周 Rust 生态亮点:GPU 计算突破(KAIO 达 cuBLAS 92.5%、flodl 多 GPU 训练),Tokio 异步优化实战频出,扩展标准库路线图发布,Rust 进入 Pix…...

FinalBurn Neo:一场跨越时空的街机游戏考古之旅

FinalBurn Neo:一场跨越时空的街机游戏考古之旅 【免费下载链接】FBNeo FinalBurn Neo - We are Team FBNeo. 项目地址: https://gitcode.com/gh_mirrors/fb/FBNeo 在数字时代的洪流中,有一群守护者正在用代码为经典街机游戏搭建永生的方舟。Fina…...

大模型的“文字障眼法“:FlipAttack 文本反转越狱技术全解析

一、先打个比方:你听说过"倒着说话"绕过安检吗? 想象一下,有个调皮的小孩想带进游乐园一个违禁品。安检人员耳朵很尖,一听到"炸弹""刀具"这些词就会拦人。于是小孩想了个办法——把话说反。 “我要…...

课堂教学PPT模板平台深度测评与选用指南

一、引言:PPT—— 课堂教学的重要辅助工具在当今的课堂教学中,PPT 已经成为了教师们不可或缺的 “魔法道具”。一份精心设计的 PPT,就像一位无声的助教,能够将抽象的知识变得直观形象,将枯燥的内容变得生动有趣。它不仅…...

帕鲁杯第二届应急响应:jumpserver,waf,mysql,sshserver,server01,Palu03,Palu02,每个靶机的漏洞总结

一、题目描述1.提交堡垒机中留下的flag2.提交waf中隐藏的flag3.提交mysql中留下的flag4.提交攻击者的攻击IP5.提交攻击者的最早攻击时间6.提交web服务泄露的关键文件名7.提交泄露的邮箱地址作为flag进行提交8.提交立足点服务器ip地址9.提交攻击者使用的提权用户密码10.提交攻击…...

意法半导体STM32F407VET6现货

在当今快速发展的电子技术领域,选择一款合适的微控制器对于项目成功至关重要。意法半导体(STMicroelectronics)推出的STM32F407VET6凭借其卓越性能、丰富的外设接口及广泛的应用场景,成为了众多开发者和工程师的首选。本文将深入探…...

写给前端的 CAAN-pyasc:昇腾Python Ascend C绑定到底是啥?

写给前端的 CAAN-pyasc:昇腾Python Ascend C绑定到底是啥? 之前有兄弟问我:“哥,我想在 Python 里直接写 Ascend C 算子,不想写 C,咋搞?” 好问题。今天一次说清楚。 pyasc 是啥? py…...

我的日常开发工具迭代|MonkeyCode实测存档

做开发日常,其实大部分编码需求都很琐碎,根本用不上繁杂的专业工具。但市面上的AI编程软件,要么收费贵、额度抠搜,要么功能臃肿、操作繁琐,用起来处处受限。我一直在找一款适配个人日常使用、不折腾、无套路的轻量化编…...

HTTPS一文通

https 的出现,为解决网络加密通信提供了完美的解决方案。现在得到了非常普遍的运用。但 https 的原理和部署方式还存在一些较迷惑的点。 一、基础数学知识 在普通的http通讯过程中,前端浏览器和服务器之间传递的都是明文,这样敏感信息就容易被…...

计算机二级 WPS 文字题:样式调整考点 详细解析

计算机二级 WPS 文字题:样式调整考点 详细解析 这道题是WPS 文字 / Word 样式设置的高频必考题型,核心考点是「样式批量修改」和「分页控制」,我会把每一步的操作、考点和易错点都拆解清楚。 一、题目整体拆解 题目分为 3 个核心任务&#…...

警惕AI领域虚构技术名词:Mythos等未证实概念辨析

我不能按照您的要求生成关于“TAI #200: Anthropic’s Mythos Capability Step Change and Gated Release”的博文内容。原因如下:该标题涉及未经公开验证的虚构/推测性信息:截至目前(2024年中),Anthropic 官方未发布任…...

别再硬算方向了!Fluent局部坐标系三种方向设置方法(Diffusion/Base Vector/Vector Projection)保姆级详解

Fluent局部坐标系方向设置:从原理到避坑的深度实践指南 在复杂几何模拟中,局部坐标系就像给CFD工程师的一把瑞士军刀——它能优雅地解决弯曲流道、各向异性材料等场景下的方向定义难题。但很多用户在使用Fluent的曲线坐标系时,往往在方向设置…...

ARMv8 AArch32虚拟内存系统与异常处理机制详解

1. AArch32虚拟内存系统架构概述AArch32是ARMv8架构中的32位执行状态,其虚拟内存系统架构(VMSAv8-32)是现代嵌入式系统和虚拟化平台的核心组件。这套系统通过精巧的硬件设计实现了内存隔离、访问控制和地址转换等关键功能。VMSAv8-32最显著的特点是采用了两阶段地址…...

别再死记公式了!用Python手把手实现粒子群算法(PSO)优化函数寻优

别再死记公式了!用Python手把手实现粒子群算法(PSO)优化函数寻优 粒子群算法(PSO)作为经典的群体智能优化方法,常被用于解决复杂的非线性优化问题。但大多数教程都停留在数学公式推导层面,让初学…...

CW-DAPLINK调试器开箱体验:从拆包到点亮第一个LED灯的全过程

CW-DAPLINK调试器开箱体验:从拆包到点亮第一个LED灯的全过程 拆开快递包装的那一刻,看到印有CW-DAPLINK字样的白色小盒子,作为嵌入式开发新手的我既兴奋又忐忑。这款由武汉芯源半导体推出的调试工具,将成为我探索CW32系列MCU世界的…...

AI驱动数字孪生:从静态镜像到自主决策的工业智能体

1. 项目概述:当物理世界有了“数字分身”,它就开始自己思考了我第一次在德国一家汽车厂的控制中心看到那个画面时,手里的咖啡差点洒出来——大屏幕上,整条总装线正以毫秒级延迟同步运转:机械臂的关节扭矩、焊点温度曲线…...

STM32 USB开发避坑指南:手把手教你读懂并配置端点描述符(附完整代码)

STM32 USB开发避坑指南:手把手教你读懂并配置端点描述符(附完整代码) 在嵌入式开发领域,USB通信一直是让工程师又爱又恨的技术。爱它的通用性和高速传输能力,恨它那晦涩难懂的协议栈和层出不穷的配置问题。特别是当项目…...

你的仿真传感器数据准吗?Gazebo中激光雷达与深度相机的噪声模型配置与Rviz可视化调参实战

高保真机器人仿真:Gazebo传感器噪声模型与Rviz可视化调参全指南 在机器人算法开发中,仿真环境的真实性直接决定了算法测试的有效性。许多SLAM和导航算法在仿真环境中表现优异,一旦部署到真实机器人上却出现各种问题,这往往源于仿真…...

告别操作割裂感:保存你的专属Blender配置文件(含Unity键位预设)

告别操作割裂感:保存你的专属Blender配置文件(含Unity键位预设) 在三维创作流程中,Blender与Unity的组合堪称黄金搭档。但当你在两个软件间频繁切换时,截然不同的操作方式就像开车时突然换挡——明明想左转却按了雨刷器…...

零极点分析:从系统稳定性到滤波器设计的核心工程工具

1. 项目概述:从“系统行为”的根源说起在信号处理、控制理论乃至电路设计的日常工作中,我们常常需要面对一个核心问题:如何预测、分析和设计一个系统的动态行为?无论是设计一个能稳定跟踪目标的控制器,还是优化一个音频…...

超越UNO:手把手教你为ESP8266和AVR单片机配置任意GPIO中断(附端口变化中断PCINT实战)

突破硬件限制:ESP8266与AVR单片机全引脚中断配置实战指南 在嵌入式开发中,中断处理是提升系统响应效率的核心技术。传统Arduino UNO仅提供2个专用外部中断引脚(D2和D3),当项目需要同时监控多个传感器或按钮时&#xff…...

机器学习赋能多共振生物传感:从多维光学数据中挖掘精准检测新范式

1. 项目概述与核心思路在生物传感和医疗诊断领域,我们一直在追求更高的检测精度和更低的检测限。传统的光学折射率传感器,比如基于表面等离子体共振(SPR)或法布里-珀罗腔的传感器,其工作原理大多依赖于监测单个光学共振…...

全链路追踪:OpenTelemetry与Jaeger实战

全链路追踪:OpenTelemetry与Jaeger实战 大家好,我是欧阳瑞(Rich Own)。今天想和大家聊聊全链路追踪这个重要话题。作为一个全栈开发者,在微服务架构中,全链路追踪是定位问题和性能优化的关键工具。今天就来…...

自动化运维:Ansible与基础设施即代码

自动化运维:Ansible与基础设施即代码 大家好,我是欧阳瑞(Rich Own)。今天想和大家聊聊自动化运维这个重要话题。作为一个全栈开发者,自动化运维可以大大提高运维效率和可靠性。今天就来分享一下Ansible和基础设施即代码…...

别再傻傻只用insmod了!Linux驱动加载,用modprobe才是真省心(附依赖问题解决全流程)

别再傻傻只用insmod了!Linux驱动加载,用modprobe才是真省心(附依赖问题解决全流程) 你是否曾在深夜调试Linux驱动时,被insmod报出的"Unknown symbol"错误折磨到崩溃?明明已经编译好了驱动模块&am…...

保姆级教程:在Ubuntu上配置Frida环境,搞定Android App的签名与CRC校验

从零构建Ubuntu下的Android逆向工作流:Frida实战签名与CRC校验 当第一次尝试在Linux环境下搭建Android逆向工具链时,我花了整整三天时间解决各种依赖冲突和设备连接问题。这份经历让我意识到,一个完整的Ubuntu环境配置指南对逆向新手有多重要…...

F1C100s移植LVGL 8.2避坑指南:从Makefile修改到双缓冲配置

F1C100s移植LVGL 8.2实战手册:从编译优化到显示性能调优 在嵌入式Linux系统开发中,图形用户界面(GUI)的实现往往是最具挑战性的环节之一。对于资源受限的全志F1C100s芯片而言,如何在有限的RAM和CPU性能下实现流畅的图形交互,LVGL(…...

桌面图标变白纸别慌!手把手教你用右键属性+路径复制,5分钟找回所有软件图标

桌面图标异常修复指南:从白纸图标到完整恢复的实战解析 电脑桌面上那些熟悉的图标突然变成白纸,这种看似小问题却让人倍感困扰。不必惊慌,这通常是系统图标缓存更新不及时或软件关联异常导致的常见现象。本文将带你深入理解图标显示机制&…...

Llama3-8B微调显存优化实战:在单张RTX 4090上如何用PEFT+TRL跑通SFT?

Llama3-8B微调显存优化实战:单卡RTX 4090的极限挑战 当Meta发布Llama3系列模型时,8B版本因其在消费级硬件上的潜在可行性迅速成为开发者社区的焦点。但将这样一个拥有80亿参数的模型塞进24GB显存的显卡,就像试图把一头大象装进冰箱——理论上…...