当前位置: 首页 > article >正文

《数据结构》| 第十章 排序算法实战指南

1. 排序算法入门为什么我们需要这么多排序方法第一次接触排序算法时很多人都会有这样的疑问既然都能把数据排好序为什么还要学这么多种算法这就像装修时既有电钻又有锤子——每种工具都有最适合的使用场景。我在处理千万级用户数据时就曾因为选错排序算法导致系统卡死最后不得不半夜爬起来重写代码。排序的本质是重新排列数据元素使得关键字可以理解为数据的身份证号按特定顺序排列。举个生活中的例子整理书架时你可以按出版时间排插入排序也可以先按语种分类再分别排序归并排序甚至可以把所有书摊在地上一次性整理快速排序。不同的整理方式花费的时间和空间完全不同。稳定性是排序算法的重要特性就像整理扑克牌时如果两张红桃5原本是上下相邻的排序后它们的相对位置不应该改变。这在处理多关键字排序时特别重要比如先按分数排序再按学号排序稳定的算法能保留之前的排序结果。2. 插入排序像打扑克一样整理数据2.1 直接插入排序我教女儿编程时最喜欢用扑克牌演示插入排序。想象你手里已经有三张排好序的牌3、5、8现在摸到一张4你会自然地把它插在3和5之间后面的牌依次后移——这就是直接插入排序的核心思想。def insertion_sort(arr): for i in range(1, len(arr)): # 从第二个元素开始 key arr[i] j i-1 while j 0 and key arr[j]: # 向前找到合适位置 arr[j1] arr[j] # 元素后移 j - 1 arr[j1] key # 插入这个算法在小规模数据n100时效率惊人。我做过测试对100个随机数排序它比快速排序还快但当数据量增大时它的O(n²)时间复杂度就开始显现劣势。有个优化技巧先用二分查找确定插入位置可以减少比较次数但移动操作无法避免。2.2 希尔排序分而治之的插入优化1959年Shell提出的这个算法是我处理中型数据集几千到几万条的利器。它先把数据按间隔分组比如每隔5个元素取一个对每组进行插入排序然后逐步缩小间隔直至1。这就像先把杂乱的书架按区域整理最后再做精细调整。def shell_sort(arr): n len(arr) gap n // 2 while gap 0: for i in range(gap, n): temp arr[i] j i while j gap and arr[j-gap] temp: arr[j] arr[j-gap] j - gap arr[j] temp gap // 2实测在10000条数据排序时希尔排序比直接插入快20倍以上。但要注意间隔序列的选择——我用过Hibbard序列(1,3,7,15...)比简单的折半间隔效率提升约15%。3. 交换排序让元素在碰撞中找到位置3.1 冒泡排序虽然效率不高但冒泡排序的教学价值无可替代。它像水中的气泡一样每次比较相邻元素将最大的冒到最后。我常用它演示算法可视化def bubble_sort(arr): n len(arr) for i in range(n): swapped False for j in range(0, n-i-1): if arr[j] arr[j1]: arr[j], arr[j1] arr[j1], arr[j] swapped True if not swapped: # 提前退出优化 break加入swapped标志后对已排序数组能达到O(n)时间复杂度。有个冷知识鸡尾酒排序双向冒泡在某些场景下比传统冒泡快2倍但总体还是O(n²)级别。3.2 快速排序分治思想的巅峰之作这是我日常使用最多的排序算法它的平均O(nlogn)时间复杂度非常优秀。但第一次实现时我犯了个典型错误——总是选择第一个元素作为基准点pivot导致对已排序数组退化为O(n²)。def quick_sort(arr): if len(arr) 1: return arr pivot arr[len(arr)//2] # 选择中间值作为基准 left [x for x in arr if x pivot] middle [x for x in arr if x pivot] right [x for x in arr if x pivot] return quick_sort(left) middle quick_sort(right)实际工程中我会采用三数取中法选头、中、尾的中位数确定pivot。在处理百万级数据时还发现个技巧当子数组小于某个阈值比如20时改用插入排序能提升约10%性能。4. 选择排序与归并排序4.1 简单选择排序每次选择最小元素放到已排序序列末尾就像打牌时不断从手牌中选出最小的打出。虽然时间复杂度也是O(n²)但它有个特点移动次数最少不超过n次适合那些移动成本高的场景比如大型对象排序。def selection_sort(arr): for i in range(len(arr)): min_idx i for j in range(i1, len(arr)): if arr[j] arr[min_idx]: min_idx j arr[i], arr[min_idx] arr[min_idx], arr[i]4.2 归并排序稳定高效的典范处理超大规模数据比如TB级日志时归并排序是我的首选。它的分治思想特别适合并行化和外部排序数据无法全部加载到内存的情况。记得第一次实现时我被递归栈溢出坑惨了——后来改用迭代版才解决问题。def merge_sort(arr): if len(arr) 1: mid len(arr)//2 L arr[:mid] R arr[mid:] merge_sort(L) merge_sort(R) i j k 0 while i len(L) and j len(R): if L[i] R[j]: arr[k] L[i] i 1 else: arr[k] R[j] j 1 k 1 while i len(L): arr[k] L[i] i 1 k 1 while j len(R): arr[k] R[j] j 1 k 1有个实际案例处理千万级用户行为数据时我先把数据分割成100个块分别排序再两两归并最后用多路归并完成整体排序比直接排序快3倍以上。5. 实战选型指南什么场景用什么算法经过多年踩坑我总结出这套选型原则小数据量n100直接插入排序最简单高效基本有序数据插入排序或冒泡排序带提前退出中型数据集100n10000希尔排序或快速排序注意pivot选择大型随机数据快速排序工业级实现会结合插入排序优化稳定性要求高归并排序如金融交易记录排序内存受限环境堆排序空间复杂度O(1)外部排序多路归并排序处理无法全部加载到内存的数据在具体实现时还要考虑语言特性。比如Python的TimSort归并插入混合就在大多数场景下表现优异。有次我用Java处理对象排序发现Comparator的实现方式会影响快速排序性能——这时改用归并排序反而更稳定。最后分享一个性能测试数据排序100万随机整数快速排序0.45秒归并排序0.62秒希尔排序1.83秒插入排序超过10分钟未完成测试

相关文章:

《数据结构》| 第十章 排序算法实战指南

1. 排序算法入门:为什么我们需要这么多排序方法? 第一次接触排序算法时,很多人都会有这样的疑问:既然都能把数据排好序,为什么还要学这么多种算法?这就像装修时既有电钻又有锤子——每种工具都有最适合的使…...

3分钟打造macOS级桌面体验:开源光标主题全攻略

3分钟打造macOS级桌面体验:开源光标主题全攻略 【免费下载链接】apple_cursor Free & Open source macOS Cursors. 项目地址: https://gitcode.com/gh_mirrors/ap/apple_cursor 你知道吗?每天在电脑前工作8小时,你的鼠标指针会出现…...

实用教程!用fft npainting lama镜像批量处理图片水印

实用教程!用fft npainting lama镜像批量处理图片水印 1. 引言 1.1 为什么需要批量水印处理 在日常工作中,我们经常遇到需要处理大量带有水印图片的情况。无论是电商平台的商品图、社交媒体上的素材,还是企业内部文档,水印的存在…...

用了Trae写业务系统,为什么上线前总要手动补依赖和权限?

发版前夜,测试跑穿才发现前端字段跟后端对不上,改到凌晨三点才勉强收口。这种场景在引入 AI Coding 后并不罕见,不少团队用了 Trae 写业务系统,速度是上去了,可上线前总得花半天专门查安全漏洞和依赖冲突。大家原指望 …...

零中断迁移:企业级文档系统全流程实战指南

零中断迁移:企业级文档系统全流程实战指南 【免费下载链接】outline Outline 是一个基于 React 和 Node.js 打造的快速、协作式团队知识库。它可以让团队方便地存储和管理知识信息。你可以直接使用其托管版本,也可以自己运行或参与开发。源项目地址&…...

用了Qoder写代码飞快,联调时却总因字段不一致返工,问题出在哪?

发版前夜,前端字段对不上后端接口,联调卡了整晚。这种场景在 AI Coding 普及后并不罕见,不少团队用了 Qoder 觉得生成快、跑通快,可一旦要改需求,系统就僵住了。看似工具背锅,其实根子往往不在速度&#xf…...

刚刚,英伟达革了自己的命:智能体自主进化7天,干掉所有算子工程师、GPU专家

这应该是今天刚刚出炉的、最炸裂的文章。在很多算子开发的微信群组,已经掀起了轩然大波。「这或许是超人类智能在软件领域的真正首次展露。」英伟达许冰刚刚在 X 上发出了如此断言。他所评论的,正是他与 Terry Chen 和 Zhifan Ye 为共同一作的一项英伟达…...

如何用QuickRecorder解决macOS录屏痛点:高效专业的从入门到精通实践指南

如何用QuickRecorder解决macOS录屏痛点:高效专业的从入门到精通实践指南 【免费下载链接】QuickRecorder A lightweight screen recorder based on ScreenCapture Kit for macOS / 基于 ScreenCapture Kit 的轻量化多功能 macOS 录屏工具 项目地址: https://gitco…...

aircrack-ng使用教程

aircrack-ng是一款用于无线网络安全评估的工具套件,主要用于破解WEP和WPA/WPA2-PSK加密的无线网络密码。它通过分析捕获的数据包,利用密码破解技术来获取网络密钥,是网络安全测试和渗透测试中常用的工具之一。该工具支持多种攻击模式和优化选…...

bully使用教程

bully是一款用于破解Wi-Fi Protected Setup(WPS)的工具,主要通过暴力破解WPS PIN码来获取无线网络的访问权限。WPS是一种简化Wi-Fi设备连接的协议,由于其设计缺陷,使得通过暴力破解PIN码来获取网络密钥成为可能。bully…...

告别“替身攻击”:手把手教你用零阶优化(ZOO)直接黑盒攻击DNN模型

零阶优化实战:无需替代模型的黑盒对抗攻击指南 当面对一个部署在云端的深度学习API时,传统白盒攻击手段往往束手无策——既无法获取模型架构,也不能执行反向传播。本文将揭示如何运用零阶优化技术,仅通过输入输出查询就能构造高效…...

告别Finalshell内存焦虑:实测Xshell 8与MobaXterm,哪款才是低资源占用的SSH神器?

深度评测:Xshell 8与MobaXterm如何解决SSH工具的资源占用难题? 当你的开发工作流被频繁的内存告警打断时,选择一款轻量高效的SSH工具就成为了提升生产力的关键。作为每天需要连接多台服务器的开发者,我深刻理解那种看着任务管理器…...

打造轻量级Windows系统:Tiny11Builder深度应用指南

打造轻量级Windows系统:Tiny11Builder深度应用指南 【免费下载链接】tiny11builder Scripts to build a trimmed-down Windows 11 image. 项目地址: https://gitcode.com/GitHub_Trending/ti/tiny11builder 价值定位:解决三大系统痛点 你的Windo…...

vLLM-v0.17.1实操手册:Prometheus监控指标接入与告警配置

vLLM-v0.17.1实操手册:Prometheus监控指标接入与告警配置 1. vLLM框架简介 vLLM是一个专为大型语言模型(LLM)设计的高性能推理和服务库,由加州大学伯克利分校的天空计算实验室(Sky Computing Lab)开发,现已发展为社区驱动的开源项目。这个框…...

UniHacker:Unity引擎功能探索的技术研究指南

UniHacker:Unity引擎功能探索的技术研究指南 【免费下载链接】UniHacker 为Windows、MacOS、Linux和Docker修补所有版本的Unity3D和UnityHub 项目地址: https://gitcode.com/GitHub_Trending/un/UniHacker 技术研究免责声明 本指南所述工具及方法仅用于技术…...

微信单向好友检测终极指南:如何一键找出并清理删除你的微信好友

微信单向好友检测终极指南:如何一键找出并清理删除你的微信好友 【免费下载链接】WechatRealFriends 微信好友关系一键检测,基于微信ipad协议,看看有没有朋友偷偷删掉或者拉黑你 项目地址: https://gitcode.com/gh_mirrors/we/WechatRealFr…...

TMSpeech:Windows端离线实时语音转文字工具的完整使用指南

TMSpeech:Windows端离线实时语音转文字工具的完整使用指南 【免费下载链接】TMSpeech 腾讯会议摸鱼工具 项目地址: https://gitcode.com/gh_mirrors/tm/TMSpeech 在数字办公和在线会议成为日常的今天,你是否曾因会议内容过多而错过关键信息&#…...

新手避坑指南:用DJI NAZA-LITE飞控组装F450无人机,从焊接电调到GPS校准的完整流程

新手避坑指南:用DJI NAZA-LITE飞控组装F450无人机,从焊接电调到GPS校准的完整流程 第一次组装无人机就像玩一场高风险的拼图游戏——每个零件的位置、每根接线的顺序都可能影响最终能否安全起飞。作为过来人,我清楚地记得焊接电调时锡珠飞溅的…...

如何通过FCEUX实现NES游戏高精度模拟?解锁经典游戏的数字化体验

如何通过FCEUX实现NES游戏高精度模拟?解锁经典游戏的数字化体验 【免费下载链接】fceux FCEUX, a NES Emulator 项目地址: https://gitcode.com/gh_mirrors/fc/fceux 你是否曾因找不到可靠的NES模拟器而无法重温童年经典游戏?是否遇到过模拟器兼容…...

Go语言广播系统设计:基于Channel的高性能事件分发机制

引言 在后端系统架构中,事件广播是一种常见的通信模式。本文将深入分析一个基于Go语言channel实现的广播管理器,探讨其设计思想、实现细节以及在实际项目中的应用价值。 参考代码 点击直达 背景与需求 在许多应用场景中,我们需要实现一对…...

Wan2.2-I2V-A14B开源可部署:符合等保2.0要求,支持审计日志+访问控制

Wan2.2-I2V-A14B开源可部署:符合等保2.0要求,支持审计日志访问控制 1. 镜像概述与核心特性 Wan2.2-I2V-A14B是一款专为文生视频任务优化的私有部署镜像,基于RTX 4090D 24GB显存显卡和CUDA 12.4环境深度定制。本镜像不仅提供高性能的视频生成…...

Redis监听Key过期事件报错?教你两种绕过CONFIG命令的实用方案

Redis监听Key过期事件的两种安全实践方案 Redis的Key过期事件监听是许多业务场景中的核心需求,比如订单超时处理、会话管理、缓存刷新等。但在云服务环境中,开发者常会遇到ERR unknown command CONFIG的报错,这通常是因为云服务提供商出于安全…...

3步构建智能无人机防御系统:从威胁识别到实时追踪的实践指南

3步构建智能无人机防御系统:从威胁识别到实时追踪的实践指南 【免费下载链接】Anti-UAV 🔥🔥Official Repository for Anti-UAV🔥🔥 项目地址: https://gitcode.com/gh_mirrors/an/Anti-UAV 一、安全威胁&#…...

环境感知驱动的EFI构建:让OpenCore配置效率提升300%

环境感知驱动的EFI构建:让OpenCore配置效率提升300% 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify OpenCore配置(OpenCore是一…...

全网资源嗅探下载神器:轻松获取视频音频资源的终极指南

全网资源嗅探下载神器:轻松获取视频音频资源的终极指南 【免费下载链接】res-downloader 资源下载器、网络资源嗅探,支持微信视频号下载、网页抖音无水印下载、网页快手无水印视频下载、酷狗音乐下载等网络资源拦截下载! 项目地址: https://gitcode.co…...

手把手调参:在TMS320F28034上实现永磁电机的高功率因数控制(附代码思路)

手把手调参:在TMS320F28034上实现永磁电机的高功率因数控制(附代码思路) 当你在调试一台采用薄膜电容的永磁电机驱动器时,是否遇到过这样的困境:明明按照教科书设计了PWM波形,但实测功率因数始终卡在0.92上…...

目前专业的LED数码管屏厂商哪家好

在现代显示技术领域,LED数码管屏因其高亮度、低功耗和长寿命等特点,广泛应用于各种电子设备中。选择一家专业的LED数码管屏厂商至关重要。本文将为您推荐几家市场上表现突出的厂商,并进行详细对比。1. 杭州斡能电子有限公司公司简介&#xff…...

全桥LLC变换器死区时间优化实战:从IGBT硬开通到完美ZVS的调试记录

全桥LLC变换器死区时间优化实战:从IGBT硬开通到完美ZVS的调试记录 在电力电子领域,LLC谐振变换器因其高效率、高功率密度和良好的EMI特性,已成为中高功率应用的理想选择。然而,实际调试过程中,死区时间与励磁电感的匹配…...

深求·墨鉴实战教程:DeepSeek-OCR-2 API接入企业OA系统实现自动归档

深求墨鉴实战教程:DeepSeek-OCR-2 API接入企业OA系统实现自动归档 1. 引言:企业文档管理的痛点与解决方案 在日常办公中,企业每天都会产生大量的纸质文档和电子文件,包括合同、报表、会议纪要、审批单等。传统的人工归档方式不仅…...

OpenClaw自动化测试:百川2-13B量化模型多场景准确率评估

OpenClaw自动化测试:百川2-13B量化模型多场景准确率评估 1. 测试背景与目标 去年冬天,我在为团队寻找一个能处理本地自动化任务的AI助手时,偶然发现了OpenClaw这个开源框架。当时最让我头疼的是,市面上的大模型要么太贵&#xf…...