当前位置: 首页 > article >正文

【LeetCode刷题日记】347.前k个高频元素

个人主页北极的代码欢迎来访作者简介java后端学习者❄️个人专栏苍穹外卖日记SSM框架深入JavaWeb✨命运的结局尽可永在不屈的挑战却不可须臾或缺摘要本文介绍了两种基于堆结构优先级队列的算法实现用于解决返回数组中出现频率前k高的元素问题。方法一使用大顶堆对所有元素进行排序后取前k个方法二采用更高效的小顶堆仅维护k个元素通过不断替换堆顶来保留高频元素。两种方法都先用哈希表统计元素频率再通过不同堆结构进行排序最终时间复杂度优于O(nlogn)。小顶堆实现更为优化仅需O(nlogk)时间复杂度适合处理大规模数据。题目背景347.前k个高频元素中等给你一个整数数组nums和一个整数k请你返回其中出现频率前k高的元素。你可以按任意顺序返回答案。示例 1输入nums [1,1,1,2,2,3], k 2输出[1,2]示例 2输入nums [1], k 1输出[1]示例 3输入nums [1,2,1,2,1,2,3,1,3,2], k 2输出[1,2]提示1 nums.length 105-104 nums[i] 104k的取值范围是[1, 数组中不相同的元素的个数]题目数据保证答案唯一换句话说数组中前k个高频元素的集合是唯一的进阶你所设计算法的时间复杂度必须优于O(n log n)其中n是数组大小。题目分析我们拿到这个题目题目要求是返回出现频率前k高的元素那我们首先想到的就是要记录给定数组中元素的出现次数然后我们要返回元素就不能仅仅记录次数要记录两个数据并且这个次数是和元素一一对应的这里我们能想到map集合很容易。记录完次数之后我们要返回前k个频率高的也就是说我们要对次数进行排序然后返回数组中的前k个的元素。对频率进行排序这里我们可以使用一种 容器适配器就是优先队列。这是整体的思路关于优先队列其实就是一个披着队列外衣的堆因为优先级队列对外接口只是从队头取元素从队尾添加元素再无其他取元素的方式看起来就是一个队列。而且优先级队列内部元素是自动依照元素的权值排列。那么它是如何有序排列的呢缺省情况下priority_queue利用max-heap大顶堆完成对元素的排序这个大顶堆是以vector为表现形式的complete binary tree完全二叉树。什么是堆呢堆是一棵完全二叉树树中每个结点的值都不小于或不大于其左右孩子的值。如果父亲结点是大于等于左右孩子就是大顶堆小于等于左右孩子就是小顶堆。所以大家经常说的大顶堆堆头是最大元素小顶堆堆头是最小元素如果懒得自己实现的话就直接用priority_queue优先级队列就可以了底层实现都是一样的从小到大排就是小顶堆从大到小排就是大顶堆。本题我们就要使用优先级队列来对部分频率进行排序。为什么不用快排呢 使用快排要将map转换为vector的结构然后对整个数组进行排序 而这种场景下我们其实只需要维护k个有序的序列就可以了所以使用优先级队列是最优的。此时要思考一下是使用小顶堆呢还是大顶堆有的同学一想题目要求前 K 个高频元素那么果断用大顶堆啊。那么问题来了定义一个大小为k的大顶堆在每次移动更新大顶堆的时候每次弹出都把最大的元素弹出去了那么怎么保留下来前K个高频元素呢。而且使用大顶堆就要把所有元素都进行排序那能不能只排序k个元素呢但其实大顶堆也能实现我们一起看看吧。所以我们要用小顶堆因为要统计最大前k个元素只有小顶堆每次将最小的元素弹出最后小顶堆里积累的才是前k个最大元素。代码实现小顶堆实现先构建map集合来记录元素出现的频率循环遍历数组进行添加map.put(num, map.getOrDefault(num,0) 1);查找当前次数map.getOrDefault(num, 0)会去哈希表里查找num已经出现了几次。如果之前没出现过查不到就返回默认值0。次数加一把查到的次数可能是默认的0也可能是之前的数字加上1。存回哈希表map.put(num, ...)把更新后的次数重新存储到哈希表中键是num值是它最新的出现次数。然后我们就要用优先级队列对频率进行排序先构建一个优先队列PriorityQueueint[] pq new PriorityQueue((pair1, pair2) - pair1[1] - pair2[1]);PriorityQueueint[]创建了一个优先队列堆队列里每个元素都是一个长度为2的数组int[]这个数组的第一个位置pair[0]存数字本身第二个位置pair[1]存这个数字出现的次数频率。(pair1, pair2) - pair1[1] - pair2[1]这是一个比较规则Comparator决定了堆的排序方式。它比较两个数组的第二个元素即频率。如果pair1[1] - pair2[1]的结果是负数说明pair1的频率更小pair1会排在pair2前面。这个规则会让频率小的数组成为堆顶最先被取出的元素。然后我们进行添加有两个判断条件我们不需要添加所有因为用的是小顶堆当小于k个的时候直接添加下面的添加是核心逻辑大于k时我们要弹出队头也就是此时堆中频率最小的元素把新添加的放进去然后根据我们的规则继续进行比较排序// 堆内部自动执行 1. 把新元素放到末尾 → [[2,2], [1,3], [3,1]] 2. 比较 (3,1) 和它的父节点 (2,2): 调用你的规则compare([3,1], [2,2]) 1 - 2 -1 结果为负数 → [3,1] 应该排在 [2,2] 前面 所以交换 → [[3,1], [1,3], [2,2]] 3. 继续比较 (3,1) 和新的父节点没有→ 停止整体效果因为堆顶永远是当前堆里频率最小的那个数字所以当你维护这个堆的大小不超过k时堆里剩下的k个元素就是频率最大的前 k 个数字堆顶是第 k 大的频率。简单总结这行代码创建了一个按频率从小到大排序的小顶堆用于在遍历过程中随时淘汰频率不够大的数字最终留下频率最高的 k 个。然后我们把结果弹出从小顶堆中取出频率最高的前 k 个元素并按频率从高到低的顺序存入结果数组。// 从小顶堆弹出先得频率低的后得频率高的 弹出顺序: [3,1] → [2,2] → [1,3] // 从后往前填让频率高的在前面 ans数组: [0] [1] [2] i2: ans[2] poll() → [3,1] // 最后弹出得放最后 i1: ans[1] poll() → [2,2] i0: ans[0] poll() → [1,3] // 最后弹出高频率放最前 // 最终结果: ans [1, 2, 3] ← 频率从高到低题目答案//解法2基于小顶堆实现 public int[] topKFrequent2(int[] nums, int k) { MapInteger,Integer map new HashMap(); //key为数组元素值,val为对应出现次数 for (int num : nums) { map.put(num, map.getOrDefault(num, 0) 1); } //在优先队列中存储二元组(num, cnt),cnt表示元素值num在数组中的出现次数 //出现次数按从队头到队尾的顺序是从小到大排,出现次数最低的在队头(相当于小顶堆) PriorityQueueint[] pq new PriorityQueue((pair1, pair2) - pair1[1] - pair2[1]); for (Map.EntryInteger, Integer entry : map.entrySet()) { //小顶堆只需要维持k个元素有序 if (pq.size() k) { //小顶堆元素个数小于k个时直接加 pq.add(new int[]{entry.getKey(), entry.getValue()}); } else { if (entry.getValue() pq.peek()[1]) { //当前元素出现次数大于小顶堆的根结点(这k个元素中出现次数最少的那个) pq.poll(); //弹出队头(小顶堆的根结点),即把堆里出现次数最少的那个删除,留下的就是出现次数多的了 pq.add(new int[]{entry.getKey(), entry.getValue()}); } } } int[] ans new int[k]; for (int i k - 1; i 0; i--) { //依次弹出小顶堆,先弹出的是堆的根,出现次数少,后面弹出的出现次数多 ans[i] pq.poll()[0]; } return ans; } }用大顶堆实现主要就是添加的逻辑有所变化我们要对所有元素进行排序这是与小顶堆的最大区别小顶堆只需要维护k个因为弹出的自动是不符合的而大顶堆不能弹出弹出的是频率最高的是题目所需要的。堆结构按频率排序: (3, 1) ← 堆顶全局最大 / \ (2, 2) (1, 3)题目答案class Solution { //解法1基于大顶堆实现 public int[] topKFrequent1(int[] nums, int k) { MapInteger,Integer map new HashMap(); //key为数组元素值,val为对应出现次数 for (int num : nums) { map.put(num, map.getOrDefault(num,0) 1); } //在优先队列中存储二元组(num, cnt),cnt表示元素值num在数组中的出现次数 //出现次数按从队头到队尾的顺序是从大到小排,出现次数最多的在队头(相当于大顶堆) PriorityQueueint[] pq new PriorityQueue((pair1, pair2) - pair2[1] - pair1[1]); for (Map.EntryInteger, Integer entry : map.entrySet()) {//大顶堆需要对所有元素进行排序 pq.add(new int[]{entry.getKey(), entry.getValue()}); } int[] ans new int[k]; for (int i 0; i k; i) { //依次从队头弹出k个,就是出现频率前k高的元素 ans[i] pq.poll()[0]; } return ans; }复杂度分析方法时间复杂度空间复杂度大顶堆O(n k log n)O(n)小顶堆O(n log k)O(k)时间O(n log k)n个元素每个元素最多push/pop一次每次O(log k)空间O(k)堆只存储k个元素 哈希表O(n)结语如果对你有帮助请点赞关注收藏你的支持就是我最大的鼓励

相关文章:

【LeetCode刷题日记】347.前k个高频元素

🔥个人主页:北极的代码(欢迎来访) 🎬作者简介:java后端学习者 ❄️个人专栏:苍穹外卖日记,SSM框架深入,JavaWeb ✨命运的结局尽可永在,不屈的挑战却不可须臾或…...

【R 4.5物联网时序数据处理终极指南】:零基础到生产级TSDB集成,覆盖xts、zoo、timetk与arrow新引擎实战

更多请点击: https://intelliparadigm.com 第一章:R 4.5物联网时序数据处理全景概览 R 4.5 版本在时间序列生态中引入了原生时序向量(tsibble v1.1 兼容性增强)、并行化 dplyr 管道支持,以及对纳秒级时间戳&#xff0…...

【LLM实时交互性能瓶颈终结者】:用Swoole协程+自定义协议替代HTTP轮询,QPS提升23.6倍实测报告

更多请点击: https://intelliparadigm.com 第一章:LLM实时交互性能瓶颈终结者:Swoole协程自定义协议方案全景概览 在大语言模型(LLM)高频、低延迟的实时对话场景中,传统 HTTP/1.1 同步阻塞模型常因连接复用…...

R语言+PHM工业实践:3天快速复现NASA涡轮引擎剩余寿命预测(附可运行GitHub仓库)

更多请点击: https://intelliparadigm.com 第一章:R语言PHM工业实践:3天快速复现NASA涡轮引擎剩余寿命预测(附可运行GitHub仓库) 本章基于NASA公开的C-MAPSS数据集,使用R语言构建端到端的预测性健康管理&…...

三格电子 SG-ECAT-HUB_4|EtherCAT 工业组网神器,一进三出重构自动化拓扑

在智能制造、机器人、产线自动化等高实时性场景中,传统 EtherCAT 线型(菊花链)组网常面临布线受限、单点故障断全线、扩展困难、同步精度不足等痛点。三格电子推出SG-ECAT-HUB_4 4 口 EtherCAT 分支器,以一进三出、多拓扑支持、DC…...

3步解锁微信数据主权:WeChatMsg技术架构与实战指南

3步解锁微信数据主权:WeChatMsg技术架构与实战指南 【免费下载链接】WeChatMsg 提取微信聊天记录,将其导出成HTML、Word、CSV文档永久保存,对聊天记录进行分析生成年度聊天报告 项目地址: https://gitcode.com/GitHub_Trending/we/WeChatMs…...

告别闪烁!用STM32的PWM+DMA驱动WS2812灯带,实现丝滑渐变效果(附完整代码)

STM32高级灯光控制:PWMDMA驱动WS2812实现影院级渐变效果 当你在深夜的工作室里调试灯光项目时,是否曾被WS2812灯带的闪烁问题困扰?那种本应流畅的彩虹渐变效果,却因为驱动方式不当而变得卡顿生硬,就像老式幻灯机切换画…...

告别电位器!用STM32和MCP4017打造一个可编程的智能分压电路(教程+源码)

基于STM32与MCP4017的智能分压电路设计与实战解析 在传统电子设计中,机械电位器因其结构简单、成本低廉而被广泛使用。然而,随着智能化需求的提升,机械电位器暴露出调节精度低、易磨损、无法远程控制等固有缺陷。本文将介绍如何利用数字可编程…...

FITC标记的Siglec-2/CD22 Fc嵌合蛋白在B细胞免疫治疗研究中的应用

一、CD22蛋白的结构特征与细胞分布CD22又被称为Siglec-2,是唾液酸结合的免疫球蛋白样凝集素家族的重要成员,属于I型跨膜蛋白,分子量为140kDa。人类CD22基因位于19号染色体长臂,编码的蛋白胞外域包含七个Ig结构域,最远端…...

大语言模型偏见检测失效的真相(R语言stats+tidyverse实战避坑手册)

更多请点击: https://intelliparadigm.com 第一章:大语言模型偏见检测失效的统计学根源 当我们在评估LLM输出中的性别、种族或地域偏见时,常依赖基于词频统计的指标(如WEAT、SEAT)或分类器驱动的偏差分数。然而&#…...

Android Studio中文语言包终极指南:3分钟实现开发效率翻倍的完整教程

Android Studio中文语言包终极指南:3分钟实现开发效率翻倍的完整教程 【免费下载链接】AndroidStudioChineseLanguagePack AndroidStudio中文插件(官方修改版本) 项目地址: https://gitcode.com/gh_mirrors/an/AndroidStudioChineseLanguagePack …...

电磁铁的磁性可以无限增强吗

电磁铁的磁性无法无限增强,这主要源于材料的磁饱和特性。当磁场强度达到临界值后,即便继续增大电流或增加线圈匝数,磁性也难以持续提升。铁芯材料内部存在大量微小磁畴,在外加磁场作用下,这些磁畴会逐渐转向与磁场一致…...

Keep开源AIOps平台:面向现代分布式系统的智能告警管理与自动化解决方案

Keep开源AIOps平台:面向现代分布式系统的智能告警管理与自动化解决方案 【免费下载链接】keep The open-source AIOps and alert management platform 项目地址: https://gitcode.com/GitHub_Trending/kee/keep 在当今云原生和微服务架构主导的技术环境中&am…...

如何快速掌握Tesseract OCR:5个简单步骤开启文字识别之旅

如何快速掌握Tesseract OCR:5个简单步骤开启文字识别之旅 【免费下载链接】tesseract Tesseract Open Source OCR Engine (main repository) 项目地址: https://gitcode.com/gh_mirrors/tes/tesseract Tesseract OCR是一个功能强大的开源光学字符识别引擎&am…...

【Dify金融问答合规审计白皮书】:基于27家持牌机构实测数据,揭示97.3%高风险问答触发点及实时拦截方案

更多请点击: https://intelliparadigm.com 第一章:Dify金融问答合规审计白皮书导言 在金融行业加速拥抱大模型应用的背景下,Dify 作为低代码 AI 应用开发平台,正被广泛用于构建智能投顾、监管问答、风险提示等高敏感度场景。然而…...

# 我用AI编程两年,差点被“驯化”:一个前端开发的反思

从依赖AI到被限流惊醒,再到重新找回自己的“决策权”和“创造力”。这篇文章记录了一个前端开发者在AI浪潮中的真实心路历程,希望能给你一些启发。 前言 作为一名前端开发,我从2024年初开始使用AI工具辅助编程。当时买的是Copilot&#xff0…...

戴尔与惠普笔记本电脑大比拼:谁在性能、价格、便携性上更胜一筹?

戴尔与惠普:如何选择适合你的笔记本电脑过去几年里,戴尔(Dell)和惠普(HP)推出了不少令人心仪的 Windows 笔记本电脑。每当有人咨询 PC 推荐时,这两个品牌总会首先被想起,因为它们都有…...

你的BLDC仿真电流波形为啥是锯齿?手把手调Simscape双闭环PI参数(附调试记录)

BLDC仿真电流波形锯齿问题全解析:从PI调参到波形优化实战指南 当你在Simscape中完成BLDC电机双闭环模型搭建,满心期待看到平滑的电流波形时,屏幕上却出现了令人不安的锯齿状波形——这种经历可能让任何工程师感到沮丧。但别担心,锯…...

2026 年手机市场供应受限价格上涨,旧款机型性价比更高成优选

2026 年新手机的困境智能手机市场因内存芯片供应受限而面临压力。2026 年推出的手机表现平平,且许多都提了价。2025 年的顶级手机如今正在打折,相比新设备,它们是更划算的选择。根据 IDC 12 月的报告,PC、智能手机和其他消费电子产…...

NVIDIA Isaac Sim相机性能基准测试与优化指南

1. 项目概述:工作站相机性能基准测试的必要性在机器人数字孪生系统的开发过程中,相机仿真的准确性直接决定了整个仿真系统的可靠性。作为NVIDIA Isaac Sim的核心传感器模块,相机仿真需要消耗大量计算资源,特别是在多相机高分辨率场…...

视觉定位技术:从GUI自动化到智能交互的演进

1. 视觉定位技术的本质与演进十年前我第一次接触GUI自动化测试时,还需要手动计算每个按钮的像素坐标。如今视觉定位技术已经让机器能够像人类一样"看懂"界面元素。这项技术的核心在于建立屏幕像素坐标与界面逻辑元素之间的智能映射关系。早期的基于坐标的…...

双曲深度强化学习的优化技术与实践

1. 双曲深度强化学习的优化困境与突破在强化学习领域,双曲几何因其独特的指数级体积增长特性,为解决层次化状态表示提供了天然优势。想象一棵不断分叉的决策树:欧几里得空间只能以多项式速率增加表示容量,而双曲空间却能完美匹配这…...

办公软件AOA二级选择题、判断题(2)

1. Word2010插入题注时如需加入章节号,如“图1-1”,无需进行的操作是()……详见附件...

别再手动重启了!用Systemd守护你的Sentinel控制台(Linux自启+健康检查)

打造企业级Sentinel控制台:Systemd全生命周期管理实战指南 在微服务架构的生产环境中,Sentinel控制台如同交通指挥中心,需要724小时不间断运行。但传统的nohup启动方式存在诸多隐患:服务崩溃后无法自动恢复、服务器重启需手动介入…...

新版小学初中课标:义务教育课程方案和各科课程标准(2025年修订版)

教育部发布《义务教育课程标准》2025年修订版,涵盖语文、数学、英语等10个学科。修订文件包括课程方案及各学科标准,在2022年版基础上进行更新完善。各学科课程标准均标注2022年版2025年修订,以PDF格式提供下载。此次修订涉及道德与法治、科学…...

【独家首发】Dify 2026文档解析精度优化内参:基于217万真实业务PDF的误差热力图+12个高危Layout Pattern规避指南

更多请点击: https://intelliparadigm.com 第一章:Dify 2026文档解析精度优化全景概览 Dify 2026 版本在文档解析引擎层面引入了多模态语义对齐机制,显著提升了 PDF、扫描件及混合格式文档中表格、公式与上下文语义的联合识别准确率。核心升…...

企业微信会话存档 API 开发实战:合规存档与数据检索全流程

背景 企业微信会话存档(Message Archive)是金融、保险、政务等强合规场景下常见需求。本文介绍如何通过企业微信官方 SDK 接入会话存档 API,实现聊天记录拉取、解密、存储与检索的完整流程。 参考文档:企业微信会话存档开发者文档…...

AISystem:鸿蒙游戏中的 AI 行为驱动

子玥酱 (掘金 / 知乎 / CSDN / 简书 同名) 大家好,我是 子玥酱,一名长期深耕在一线的前端程序媛 👩‍💻。曾就职于多家知名互联网大厂,目前在某国企负责前端软件研发相关工作,主要聚…...

FigmaCN中文插件终极指南:5种用户场景下的完美汉化解决方案

FigmaCN中文插件终极指南:5种用户场景下的完美汉化解决方案 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma的英文界面感到困惑?专业术语看不懂&…...

如何用开源AIOps平台Keep终结告警风暴,实现智能运维自动化

如何用开源AIOps平台Keep终结告警风暴,实现智能运维自动化 【免费下载链接】keep The open-source AIOps and alert management platform 项目地址: https://gitcode.com/GitHub_Trending/kee/keep 你是否也曾被深夜的告警风暴惊醒?面对满屏红色告…...