当前位置: 首页 > article >正文

python heapq

# 聊聊Python的heapq一个被低估的堆实现heapq是Python标准库里的一个模块它实现了堆队列算法也就是通常说的优先队列。这个模块不太起眼许多开发者甚至都不知道它的存在但它确实解决了不少让人头痛的问题。它到底是什么简单说heapq维护了一个列表让这个列表始终保持“堆”的特性。这个特性具体是列表的第一个元素总是最小的那个。如果往列表里添加新元素或者移除最小的那个元素它能在O(log n)的时间里完成调整保证你随时能从顶部拿到当前最小的元素。其实这就像你手头有一堆待办事项每次都挑最紧急的先处理。用heapq就能保证你每次都能快速找到那个“最紧急”的。它能做什么最直观的用途就是排序相关的场景。比如从海量数据里找出前K个最大的或最小的元素这就是典型的Top K问题。很多人可能第一反应是排序后取前K个但如果有10亿条数据呢排序再取前K个内存可能就爆了。还有一个场景是任务调度。假设你有一堆待处理的任务每个任务有不同的优先级你想每次取出优先级最高的那个来处理。用list然后每次找最大值复杂度是O(n)用heapq就是O(log n)差别挺大的。另外在网络爬虫的数据合并场景里也很有用。比如有多个已经排好序的数据源你想把它们归并成一个有序的整体heapq的归并功能就能帮上忙。怎么使用先看基本用法importheapq# 创建一个空堆heap[]# 添加元素heapq.heappush(heap,5)heapq.heappush(heap,2)heapq.heappush(heap,10)# 弹出最小元素smallestheapq.heappop(heap)# 返回2# 查看最小元素但不弹出peekheap[0]# 直接取索引0# 把列表转成堆data[5,2,10,1,8]heapq.heapify(data)# data现在变成了堆结构如果你处理的是复杂对象比如想按对象的某个属性排序可以传入一个元组importheapq heap[]heapq.heappush(heap,(priority,timestamp,data))这样heapq会先按元组的第一个元素比较如果相等再比较第二个以此类推。还有一个比较实用的函数是nlargest和nsmallestdata[5,2,10,1,8]largest_threeheapq.nlargest(3,data)# [10, 8, 5]smallest_threeheapq.nsmallest(3,data)# [1, 2, 5]一些实践中的考虑在使用heapq的时候有个容易踩的坑heapq默认实现的是最小堆。如果你想用最大堆可以存负值。比如想从一堆数里挑最大的就在入堆的时候存负数弹出的时候再取反。另外heapq的堆操作是原地修改列表的不会返回新的列表。这点和很多Python函数的行为不太一样容易让人意外。比如heapq.heappush(heap, item)不会返回新堆而是修改你传入的列表。如果你需要频繁地更新已有元素的值标准的heapq有点力不从心。比如任务调度中任务被插队或者优先级变更标准的堆实现不支持直接更新某个元素。这时候要么自己实现一个带索引的堆要么把更新操作转换成“新增一个元素”和“标记旧元素为无效”两个操作。后一种方法虽然内存占用稍大但实现起来简单得多。性能方面heapq对于百万级别的数据量表现很好。如果数据量大到内存装不下那就要考虑用外部排序或者数据库了。和其他方案的比较说到排序和选Top K首先能想到的是sorted函数。sorted会一次性把所有数据排序时间复杂度O(n log n)。如果用排序取Top K复杂度一样。而heapq取Top K只需要O(n log K)当K远小于n时优势明显。还有人会用列表的list.sort()方法效果和sorted类似区别在于就地排序。如果是单纯地每次取最大最小值用max/min也是O(n)而heapq是O(log n)。但如果只需要取一次用max/min就够了没必要建堆。另一个常被提到的数据结构是PriorityQueue它是线程安全的封装了heapq。如果你在多线程环境下使用PriorityQueue更省心。单线程下直接用heapq就好少一层包装性能更好。用第三方库的话有heapdict支持按键值更新堆元素还有sortedcontainers这种相对重量级的库。如果只是基本需求用heapq就够了没必要引入额外依赖。总体来说heapq是个小巧实用的工具适合那些需要频繁获取最小或最大元素但又不想每次都全排序的场景。它的API设计很Pythonic容易上手该有的功能都有不该有的也几乎寸没有。

相关文章:

python heapq

# 聊聊Python的heapq:一个被低估的堆实现 heapq是Python标准库里的一个模块,它实现了堆队列算法,也就是通常说的优先队列。这个模块不太起眼,许多开发者甚至都不知道它的存在,但它确实解决了不少让人头痛的问题。 它到…...

零成本解锁VMware Workstation Pro 17:从虚拟化新手到专家的完整指南

零成本解锁VMware Workstation Pro 17:从虚拟化新手到专家的完整指南 【免费下载链接】VMware-Workstation-Pro-17-Licence-Keys Free VMware Workstation Pro 17 full license keys. Weve meticulously organized thousands of keys, catering to all major versio…...

零代码部署GME多模态向量:小白也能玩转图文跨模态搜索

零代码部署GME多模态向量:小白也能玩转图文跨模态搜索 1. 为什么选择GME多模态向量模型 在日常工作和生活中,我们经常遇到这样的困扰:明明记得某张图片的内容,却怎么也找不到它;或者需要根据一段文字描述&#xff0c…...

终极图像处理指南:5分钟掌握Fiji科学图像分析技巧

终极图像处理指南:5分钟掌握Fiji科学图像分析技巧 【免费下载链接】fiji A "batteries-included" distribution of ImageJ :battery: 项目地址: https://gitcode.com/gh_mirrors/fi/fiji Fiji(Fiji Is Just ImageJ)是一款开…...

如何部署Hermes Agent/OpenClaw?2026年阿里云及Coding Plan配置详细流程

如何部署Hermes Agent/OpenClaw?2026年阿里云及Coding Plan配置详细流程。OpenClaw(前身为Clawdbot/Moltbot)作为开源、本地优先的AI助理框架,凭借724小时在线响应、多任务自动化执行、跨平台协同等核心能力,成为个人办…...

Next.js SSR/SSG:路由与渲染模式深度解析

# Next.js SSR/SSG:路由与渲染模式深度解析> **版本说明**:本文基于 Next.js 14.x 和 15.x 最新版本编写,源码路径参考 packages/next/src/ 核心模块---## 📑 目录1. [引言:渲染模式的演进](#1-引言渲染模式的演进)…...

为什么你的Llama-3-70B推理吞吐卡在142 tokens/s?CUDA 13.3 Warp Matrix Multiply-Accumulate(WMMA)对齐失效的3个隐蔽陷阱

https://intelliparadigm.com 第一章&#xff1a;Llama-3-70B推理吞吐瓶颈的系统性归因 Llama-3-70B 模型在实际部署中常遭遇显著的吞吐下降&#xff08;<15 tokens/s/GPU&#xff09;&#xff0c;其根源远非单一硬件限制&#xff0c;而是计算、内存、通信与调度四维耦合失…...

从华为LTC到企业ERP:聊聊SAP实施中那些“端到端”大流程的设计心法与避坑指南

从华为LTC到企业ERP&#xff1a;SAP实施中的端到端流程设计实战 当企业数字化转型进入深水区&#xff0c;单纯的功能模块优化已无法满足业务需求。那些在SAP实施中真正创造价值的高手&#xff0c;往往都掌握着一个核心能力——用端到端流程的视角重构企业运营逻辑。这就像建筑师…...

告别手动配置!用CMAKE_TOOLCHAIN_FILE一键搞定嵌入式ARM交叉编译(附完整文件模板)

嵌入式开发者的效率革命&#xff1a;CMAKE_TOOLCHAIN_FILE实战指南 每次为树莓派或STM32移植代码时&#xff0c;你是否厌倦了反复修改编译器路径、调整sysroot目录、手动添加-march和-mcpu参数&#xff1f;那些在终端里敲入的冗长环境变量和编译选项&#xff0c;不仅消耗时间&a…...

从V100到4090:如何为不同架构GPU(Volta/Ampere)调整CUTLASS编译参数与性能测试

从V100到RTX 4090&#xff1a;跨世代GPU的CUTLASS编译优化与性能调优实战 当实验室同时存在Volta架构的Tesla V100和Ampere架构的RTX 4090时&#xff0c;开发者面临一个现实挑战&#xff1a;如何为不同计算能力的GPU定制CUTLASS编译参数&#xff1f;这不仅关系到能否充分发挥硬…...

Kill-Doc:一键自动化文档下载工具,告别繁琐下载限制

Kill-Doc&#xff1a;一键自动化文档下载工具&#xff0c;告别繁琐下载限制 【免费下载链接】kill-doc 看到经常有小伙伴们需要下载一些免费文档&#xff0c;但是相关网站浏览体验不好各种广告&#xff0c;各种登录验证&#xff0c;需要很多步骤才能下载文档&#xff0c;该脚本…...

后量子密码学中的拒绝采样技术及硬件优化

1. 后量子密码学中的拒绝采样技术解析在量子计算快速发展的今天&#xff0c;传统公钥密码体系面临严峻挑战。多变量公钥密码&#xff08;MPKC&#xff09;因其基于NP难问题的数学特性&#xff0c;成为最具潜力的后量子密码候选方案之一。QR-UOV作为NIST第二轮数字签名标准候选算…...

RK356X Android11上GT9271触摸屏调试:从设备树配置到坐标反转的完整避坑指南

RK356X Android11平台GT9271触摸屏调试全流程实战 拿到一块RK356X开发板和GT9271触摸屏时&#xff0c;最令人头疼的莫过于驱动调试过程中那些看似简单却暗藏玄机的细节。本文将用真实的项目调试经历&#xff0c;带你完整走一遍从设备树配置到坐标校准的全过程&#xff0c;特别是…...

duckdb excel插件和rusty_sheet插件在python中的不同表现

建立虚拟环境 安装python扩展包duckdb、polars和pandas python -m venv pwin313 pwin313\scripts\activate.bat pwin313)C:\d\pwin313>pip install duckdb polars pandas在python中引入扩展包&#xff0c;安装加载duckdb插件 pwin313) C:\d\pwin313>python Python 3.13.2…...

华硕笔记本终极控制指南:G-Helper如何3步解决性能与显示问题

华硕笔记本终极控制指南&#xff1a;G-Helper如何3步解决性能与显示问题 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Str…...

嵌入式开发者的RAM管理课:在STM32H743上为自检函数划一块‘专属内存’

STM32H743内存管理实战&#xff1a;为关键功能构建专属RAM安全区 在嵌入式系统开发中&#xff0c;内存管理往往是最容易被忽视却又至关重要的环节。当项目复杂度提升到需要周期自检、实时监控等关键功能时&#xff0c;传统的内存分配方式就会暴露出各种隐患。本文将以STM32H743…...

OmenSuperHub:3分钟解锁惠普游戏本终极性能控制指南

OmenSuperHub&#xff1a;3分钟解锁惠普游戏本终极性能控制指南 【免费下载链接】OmenSuperHub 使用 WMI BIOS控制性能和风扇速度&#xff0c;自动解除DB功耗限制。 项目地址: https://gitcode.com/gh_mirrors/om/OmenSuperHub 你是否厌倦了官方Omen Gaming Hub的臃肿、…...

如何快速解决串口驱动问题:PL2303设备完整兼容指南

如何快速解决串口驱动问题&#xff1a;PL2303设备完整兼容指南 【免费下载链接】pl2303-win10 Windows 10 driver for end-of-life PL-2303 chipsets. 项目地址: https://gitcode.com/gh_mirrors/pl/pl2303-win10 你是否在Windows 10或Windows 11系统上遇到了PL2303串口…...

无名杀:开启免费开源三国杀网页版的策略革命

无名杀&#xff1a;开启免费开源三国杀网页版的策略革命 【免费下载链接】noname 项目地址: https://gitcode.com/GitHub_Trending/no/noname 在当今数字化游戏时代&#xff0c;无名杀作为一款免费开源的三国杀网页版卡牌游戏&#xff0c;为玩家提供了无需下载、跨平台…...

StreamCap:跨平台直播录制解决方案,让精彩直播永不错过

StreamCap&#xff1a;跨平台直播录制解决方案&#xff0c;让精彩直播永不错过 【免费下载链接】StreamCap Multi-Platform Live Stream Automatic Recording Tool | 多平台直播流自动录制客户端 基于FFmpeg 支持监控/定时/转码 项目地址: https://gitcode.com/gh_mirrors/…...

DXF解析成运动控制指令DEMO源代码:支持缩放与多图层控制

DXF解析成运动控制指令DEMO源代码&#xff0c;运动控制软件必备模块。 支持比例缩放 支持按图层解析&#xff0c;各图层可按加工速度、加工参数等分开控制&#xff0c;各图层可选择加工或不加工 支持点、直线、圆、圆弧、多段线解析。 暂不支持椭圆、样条曲线、文字、填充内容解…...

亦庄人形机器人半程马拉松:大厂入局改写竞争规则,赛事成具身智能行业新秩序催化剂

马拉松给具身智能产业泼冷水马拉松给具身智能产业泼了盆冷水。过去&#xff0c;资本和观众愿意给原生玩家时间&#xff0c;但这场比赛让大家看到&#xff0c;产业竞争不会因“还需要时间”而放慢。当荣耀这样的科技大厂夺冠&#xff0c;native厂商面临更大竞争压力。资本也许会…...

【2026 C语言内存安全编码白皮书】:20年一线专家亲授——97%的缓冲区溢出漏洞可被这5条规范彻底拦截

https://intelliparadigm.com 第一章&#xff1a;现代 C 语言内存安全编码规范 2026 概述 C 语言在嵌入式系统、操作系统内核及高性能基础设施中仍占据不可替代地位&#xff0c;但其原始内存模型长期暴露于缓冲区溢出、悬垂指针、未初始化内存访问等高危缺陷。2026 年发布的《…...

Rust 泛型系统的底层逻辑

Rust泛型系统的底层逻辑探秘 Rust的泛型系统是其强大类型安全的核心支柱之一&#xff0c;它不仅让代码更灵活&#xff0c;还能在编译期消除性能开销。其底层逻辑融合了类型理论、编译优化和零成本抽象思想&#xff0c;为开发者提供了高效且安全的编程体验。本文将深入剖析Rust…...

C++ MCP网关性能跃迁方案(企业级吞吐量突破280万TPS实录)

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;C MCP网关性能跃迁方案全景概览 现代微服务架构中&#xff0c;C 实现的 MCP&#xff08;Microservice Communication Protocol&#xff09;网关正面临高并发、低延迟与协议兼容性三重挑战。本方案聚焦于…...

脉冲神经网络训练效率的革命性突破与增强自蒸馏框架

1. 脉冲神经网络训练效率的革命性突破在神经形态计算领域&#xff0c;脉冲神经网络&#xff08;SNNs&#xff09;因其生物启发的特性正引发一场计算范式的变革。与依赖连续激活的传统人工神经网络&#xff08;ANNs&#xff09;不同&#xff0c;SNNs通过离散的脉冲事件传递信息&…...

【花雕动手做】为什么 MimiClaw 值得每一位嵌入式 AI Agent 开发者关注?

前言&#xff1a; 2026年&#xff0c;端侧大模型与智能体的深度融合正推动嵌入式系统从“设备控制中枢”进化为“场景智能引擎”&#xff0c;嵌入式AI赛道迎来爆发式增长&#xff0c;而MimiClaw的出现&#xff0c;为资源受限场景下的AI Agent落地提供了极具参考价值的实践范本。…...

SAP采购申请屏幕增强实战:手把手教你为ME51N/ME57添加自定义字段(附完整代码)

SAP采购申请屏幕增强实战&#xff1a;从零构建ME51N自定义字段完整方案 当采购部门的同事第5次拿着Excel表格来找你&#xff0c;要求将"供应商优先级评分"嵌入采购申请流程时&#xff0c;作为ABAP开发者的你意识到&#xff1a;是时候给ME51N来次深度改造了。不同于简…...

从BUCK到BOOST:手把手教你搞定DCDC电感与电容的选型计算(附公式与避坑点)

从BUCK到BOOST&#xff1a;手把手教你搞定DCDC电感与电容的选型计算&#xff08;附公式与避坑点&#xff09; 在电源设计领域&#xff0c;DCDC转换器的无源器件选型往往是决定整体性能的关键环节。许多工程师在初次接触BUCK或BOOST电路设计时&#xff0c;面对琳琅满目的电感和电…...

凤凰古城吃饭是否会被宰,该如何避坑?

在凤凰古城吃饭不一定会被宰&#xff0c;但确实存在一些不良商家可能会让游客多花冤枉钱。沙湾里酸汤腊猪脚是凤凰古城一家口碑较好的餐厅&#xff0c;下面为你详细介绍如何避坑。选择正规餐厅查看平台评分&#xff1a;可以在大众点评、美团等平台上查看餐厅的评分和评价。像沙…...