数据结构第16节 最大堆
最大堆是一种特殊的完全二叉树数据结构,其中每个父节点的键值都大于或等于其子节点的键值。在Java中,最大堆通常用于实现优先队列,堆排序算法,或者在需要快速访问最大元素的应用场景中。
让我们通过一个具体的案例来说明最大堆的使用和实现:假设我们正在开发一个系统,用于实时分析用户行为数据,比如网站上的点击率。系统需要持续地接收点击事件,并能够快速报告过去一段时间内最高点击率的前N个页面。
实现最大堆
为了实现这个功能,我们可以使用最大堆来保存页面的点击率,堆顶元素总是保持为当前观察窗口内的最高点击率页面。当有新的点击事件到来时,我们将更新堆以反映最新的状态。
步骤:
-
初始化堆:创建一个最大堆,可以使用数组来实现。堆中第一个元素(索引1,因为索引0通常不使用)是堆顶,也就是当前最大值。
-
添加元素:当接收到新的点击事件时,将页面和其点击率插入堆中。为了保持堆的性质,需要执行“上浮”操作,即新插入的元素与其父节点比较,如果比父节点大,则交换它们的位置,继续向上比较直到满足堆的性质为止。
-
删除元素:当需要移除堆顶元素(即最大点击率的页面)时,用堆的最后一个元素替换堆顶元素,然后执行“下沉”操作,比较该元素与其子节点,如果子节点中有更大的,则与最大的子节点交换位置,继续向下比较直到满足堆的性质为止。
-
查询最大元素:堆顶元素始终是最大元素,可以直接访问而不影响堆的结构。
示例
下面是一个简单的最大堆实现示例,用于存储整数值:
public class MaxHeap {private int[] heap;private int size;public MaxHeap(int capacity) {heap = new int[capacity + 1]; // Index 0 is not usedsize = 0;}public void insert(int value) {if (size == heap.length - 1) {throw new IllegalStateException("Heap is full");}size++;heap[size] = value;siftUp(size);}private void siftUp(int index) {while (index > 1 && heap[index / 2] < heap[index]) {swap(index, index / 2);index /= 2;}}private void swap(int i, int j) {int temp = heap[i];heap[i] = heap[j];heap[j] = temp;}public int extractMax() {if (size == 0) {throw new IllegalStateException("Heap is empty");}int max = heap[1];heap[1] = heap[size];size--;siftDown(1);return max;}private void siftDown(int index) {while (index * 2 <= size) {int child = index * 2;if (child != size && heap[child] < heap[child + 1]) {child++;}if (heap[index] >= heap[child]) {break;}swap(index, child);index = child;}}
}
使用
public class Main {public static void main(String[] args) {MaxHeap maxHeap = new MaxHeap(10);maxHeap.insert(10);maxHeap.insert(20);maxHeap.insert(15);maxHeap.insert(30);System.out.println("Maximum value: " + maxHeap.extractMax()); // Should print 30}
}
在这个案例中,我们创建了一个最大堆并插入了一些元素,然后提取了最大值。这只是一个基础的实现,实际应用中可能需要考虑更多的边界情况和异常处理。
在之前的示例中,我们创建了一个基本的最大堆数据结构。现在,我们将进一步完善这个数据结构,使其更加健壮和实用,包括添加更多功能和错误处理机制。
完善最大堆数据结构
- 增加堆的动态扩容能力:当堆满时自动扩容。
- 添加获取堆大小的方法:方便外部了解堆的状态。
- 增强错误处理:在堆为空或满时抛出更有描述性的异常。
- 添加完整打印堆的方法:便于调试和验证。
更新后的Java代码:
public class MaxHeap {private int[] heap;private int size;private int capacity;public MaxHeap(int initialCapacity) {this.capacity = initialCapacity;this.heap = new int[initialCapacity + 1]; // Index 0 is not usedthis.size = 0;}public void insert(int value) {ensureCapacity();size++;heap[size] = value;siftUp(size);}private void ensureCapacity() {if (size == heap.length - 1) {int newCapacity = heap.length * 2;heap = Arrays.copyOf(heap, newCapacity);capacity = newCapacity - 1;}}private void siftUp(int index) {while (index > 1 && heap[index / 2] < heap[index]) {swap(index, index / 2);index /= 2;}}private void swap(int i, int j) {int temp = heap[i];heap[i] = heap[j];heap[j] = temp;}public int extractMax() {if (isEmpty()) {throw new IllegalStateException("Heap is empty");}int max = heap[1];heap[1] = heap[size];size--;siftDown(1);return max;}private void siftDown(int index) {while (index * 2 <= size) {int child = index * 2;if (child != size && heap[child] < heap[child + 1]) {child++;}if (heap[index] >= heap[child]) {break;}swap(index, child);index = child;}}public boolean isEmpty() {return size == 0;}public int getSize() {return size;}public void printHeap() {for (int i = 1; i <= size; i++) {System.out.print(heap[i] + " ");}System.out.println();}
}
使用
public class Main {public static void main(String[] args) {MaxHeap maxHeap = new MaxHeap(10);maxHeap.insert(10);maxHeap.insert(20);maxHeap.insert(15);maxHeap.insert(30);System.out.println("Maximum value: " + maxHeap.extractMax()); // Should print 30maxHeap.printHeap(); // Print the current state of the heaptry {maxHeap.extractMax();maxHeap.extractMax();maxHeap.extractMax();maxHeap.extractMax();maxHeap.extractMax(); // This should throw an exception since the heap is now empty} catch (IllegalStateException e) {System.out.println(e.getMessage());}System.out.println("Heap size: " + maxHeap.getSize()); // Should print 0}
}
在这个更新的版本中,我们增加了堆的动态扩容能力,提供了获取堆大小的方法,增强了错误处理,并添加了打印堆的方法,使最大堆成为一个更完整、更健壮的数据结构。
既然我们已经建立了一个基本的最大堆,现在我们可以进一步完善它,添加更多的实用功能和优化点,比如:
- 添加构建最大堆的方法:允许从一个数组快速构建最大堆。
- 增加堆排序功能:利用最大堆进行排序。
- 优化扩容策略:使用更高效的扩容策略。
- 添加清除堆中所有元素的方法:重置堆到初始状态。
- 增加查看但不移除最大值的方法:类似于队列的peek操作。
更新后的最大堆Java代码:
public class MaxHeap<T extends Comparable<T>> {private List<T> heap = new ArrayList<>();public MaxHeap() {}public MaxHeap(T[] items) {heap.addAll(Arrays.asList(items));buildHeap();}public void insert(T value) {heap.add(value);siftUp(heap.size() - 1);}private void siftUp(int index) {while (index > 0 && heap.get(parent(index)).compareTo(heap.get(index)) < 0) {swap(index, parent(index));index = parent(index);}}private void swap(int i, int j) {T temp = heap.get(i);heap.set(i, heap.get(j));heap.set(j, temp);}public T extractMax() {if (isEmpty()) {throw new IllegalStateException("Heap is empty");}T max = heap.get(0);heap.set(0, heap.get(heap.size() - 1));heap.remove(heap.size() - 1);siftDown(0);return max;}private void siftDown(int index) {int left = leftChild(index);while (left < heap.size()) {int right = rightChild(index);int largest = (right < heap.size() && heap.get(right).compareTo(heap.get(left)) > 0) ? right : left;largest = (heap.get(largest).compareTo(heap.get(index)) > 0) ? largest : index;if (largest == index) {break;}swap(index, largest);index = largest;left = leftChild(index);}}public boolean isEmpty() {return heap.isEmpty();}public int size() {return heap.size();}public void clear() {heap.clear();}public T peekMax() {if (isEmpty()) {throw new IllegalStateException("Heap is empty");}return heap.get(0);}public void buildHeap() {for (int i = parent(heap.size() - 1); i >= 0; i--) {siftDown(i);}}private int parent(int i) {return (i - 1) / 2;}private int leftChild(int i) {return 2 * i + 1;}private int rightChild(int i) {return 2 * i + 2;}public List<T> sort() {List<T> sorted = new ArrayList<>();while (!isEmpty()) {sorted.add(extractMax());}return sorted;}
}
使用方式:
public class Main {public static void main(String[] args) {Integer[] numbers = {10, 20, 15, 30, 40};MaxHeap<Integer> maxHeap = new MaxHeap<>(numbers);System.out.println("Maximum value: " + maxHeap.peekMax()); // Should print 40System.out.println("Extracted max value: " + maxHeap.extractMax()); // Should print 40System.out.println("New maximum value: " + maxHeap.peekMax()); // Should print 30System.out.println("Sorted list: " + maxHeap.sort()); // Should print [30, 20, 15, 10]}
}
在这个版本中,我们使用了ArrayList代替原始数组,允许动态添加和移除元素,同时提供了构建最大堆、堆排序、查看最大值而不移除等功能,使得最大堆更加通用和强大。
相关文章:
数据结构第16节 最大堆
最大堆是一种特殊的完全二叉树数据结构,其中每个父节点的键值都大于或等于其子节点的键值。在Java中,最大堆通常用于实现优先队列,堆排序算法,或者在需要快速访问最大元素的应用场景中。 让我们通过一个具体的案例来说明最大堆的…...
显卡、显卡驱动、cuda、cuDNN之间关系
显卡、显卡驱动、CUDA 和 cuDNN 是构成高性能计算和深度学习环境的关键组件,它们之间有着紧密的联系。下面是对这些组件及其关系的详细介绍: 显卡(GPU) 显卡,全称为图形处理器(Graphics Processing Unit&…...
Rewrk一个更现代的http框架基准测试实用程序
Rewrk一个更现代的http框架基准测试实用程序。HTTP基准测试(HTTP benchmarking)是一种测量和评估HTTP服务器或应用程序性能指标的活动。其目的是在特定条件下模拟大量用户请求,以测量服务器或应用程序的响应能力、吞吐量、延迟等指标…...
【算法】排序算法介绍 附带C#和Python实现代码
1. 冒泡排序(Bubble Sort) 2. 选择排序(Selection Sort) 3. 插入排序(Insertion Sort) 4. 归并排序(Merge Sort) 5. 快速排序(Quick Sort) 排序算法是计算机科学中的一个基础而重要的部分,用于将一组数据按照一定的顺序排列。下面介绍几种常见的排序算法,…...
360安全浏览器就是不行-python秒破解
下面画框都很容易破解,大家试试...
Python实现傅里叶级数可视化工具
Python实现傅里叶级数可视化工具 flyfish 有matlab实现,我没matlab,我有Python,所以我用Python实现。 整个工具的实现代码放在最后,界面使用PyQt5开发 起源 傅里叶级数(Fourier Series)由法国数学家和物理学家让-巴…...
PDF 分割拆分 API 数据接口
PDF 分割拆分 API 数据接口 文件处理,PDF 高效的 PDF 分割工具,高效处理,可永久存储。 1. 产品功能 高效处理大文件;支持多语言字符识别;支持 formdata 格式 PDF 文件流传参;支持设置每个 PDF 文件的页数…...
【python】随机森林预测汽车销售
目录 引言 1. 数据收集与预处理 2. 划分数据集 3. 构建随机森林模型 4. 模型训练 5. 模型评估 6. 模型调优 数据集 代码及结果 独热编码 随机森林模型训练 特征重要性图 混淆矩阵 ROC曲线 引言 随机森林(Random Forest)是一种集成学习方法…...
Stable Diffusion教程|练丹师是如何炼丹的Lora模型训练
前言 还记得我们之前就讲过学习SD成为炼丹师不?那么今天就来手把手教大家炼丹,看看同一个角色或某种风格的小模型是如何制作出来的。 目录 1 炼丹介绍 2 环境准备 3 Lora模型训练 **一、**炼丹介绍 什么是炼丹? 早在学习SD地第一篇就…...
QT--SQLite
配置类相关的表,所以我使用sqlite,且QT自带该组件; 1.安装 sqlite-tools-win-x64-3460000、SQLiteExpert5.4.31.575 使用SQLiteExpert建好数据库.db文件,和对应的表后把db文件放在指定目录 ./db/program.db; 2.选择sql组件 3.新…...
【深度学习入门篇 ②】Pytorch完成线性回归!
🍊嗨,大家好,我是小森( ﹡ˆoˆ﹡ )! 易编橙终身成长社群创始团队嘉宾,橙似锦计划领衔成员、阿里云专家博主、腾讯云内容共创官、CSDN人工智能领域优质创作者 。 易编橙:一个帮助编程小…...
Syslog 管理工具
Syslog常被称为系统日志或系统记录,是一种用来在互联网协议(TCP/IP)的网上中传递记录档消息的标准,常用来指涉实际的Syslog 协议,或者那些提交syslog消息的应用程序或数据库。 系统日志协议(Syslog&#x…...
硅纪元AI应用推荐 | 百度橙篇成新宠,能写万字长文
“硅纪元AI应用推荐”栏目,为您精选最新、最实用的人工智能应用,无论您是AI发烧友还是新手,都能在这里找到提升生活和工作的利器。与我们一起探索AI的无限可能,开启智慧新时代! 百度橙篇,作为百度公司在202…...
Codeforces Round 954 (Div. 3)
🚀欢迎来到本文🚀 🍉个人简介:陈童学哦,彩笔ACMer一枚。 🏀所属专栏:Codeforces 本文用于记录回顾本彩笔的解题思路便于加深理解。 📢📢📢传送阵 A. X Axis解…...
【Django】报错‘staticfiles‘ is not a registered tag library
错误截图 错误原因总结 在django3.x版本中staticfiles被static替换了,所以这地方换位static即可完美运行 错误解决...
LeetCode 算法:二叉树的最近公共祖先 III c++
原题链接🔗:二叉树的最近公共祖先 难度:中等⭐️⭐️ 题目 给定一个二叉树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为:“对于有根树 T 的两个节点 p、q,最近公共祖先表示为一个节点…...
Windows CMD 命令汇总表
Windows CMD 命令汇总表 Windows CMD 命令汇总表目录操作磁盘操作文件操作其他命令FTP 命令高级系统命令批处理命令网络命令安全和权限命令 Windows CMD 命令指南目录操作MD - 创建子目录CD - 切换当前目录RD - 删除子目录DIR - 显示目录内容PATH - 设置可执行文件的搜索路径TR…...
【python+appium】自动化测试
pythonappium自动化测试系列就要告一段落了,本篇博客咱们做个小结。 首先想要说明一下,APP自动化测试可能很多公司不用,但也是大部分自动化测试工程师、高级测试工程师岗位招聘信息上要求的,所以为了更好的待遇,我们还…...
vue 数据类型
文章目录 ref 创建:基本类型的响应式数据reactive 创建:对象类型的响应式数据ref 创建:对象类型的响应式数据ref 对比 reactive将一个响应式对象中的每一个属性,转换为ref对象(toRefs 与 toRef)computed (根据计算进行修改) ref 创…...
MySQL(基础篇)
DDL (Data Definition Language) 数据定义语言,用来定义数据库对象(数据库,表, 字段) DML (Data Manipulation Languag) 数据操作语言,用来对数据库表中的数据进行增删改 DQL (Data Query Language) 数据查询语言,用…...
浏览器访问 AWS ECS 上部署的 Docker 容器(监听 80 端口)
✅ 一、ECS 服务配置 Dockerfile 确保监听 80 端口 EXPOSE 80 CMD ["nginx", "-g", "daemon off;"]或 EXPOSE 80 CMD ["python3", "-m", "http.server", "80"]任务定义(Task Definition&…...
Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例
使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件,常用于在两个集合之间进行数据转移,如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。 核心特性与用法 基本属性 v-model:绑定右侧列表的值&…...
在 Nginx Stream 层“改写”MQTT ngx_stream_mqtt_filter_module
1、为什么要修改 CONNECT 报文? 多租户隔离:自动为接入设备追加租户前缀,后端按 ClientID 拆分队列。零代码鉴权:将入站用户名替换为 OAuth Access-Token,后端 Broker 统一校验。灰度发布:根据 IP/地理位写…...
JUC笔记(上)-复习 涉及死锁 volatile synchronized CAS 原子操作
一、上下文切换 即使单核CPU也可以进行多线程执行代码,CPU会给每个线程分配CPU时间片来实现这个机制。时间片非常短,所以CPU会不断地切换线程执行,从而让我们感觉多个线程是同时执行的。时间片一般是十几毫秒(ms)。通过时间片分配算法执行。…...
C++.OpenGL (14/64)多光源(Multiple Lights)
多光源(Multiple Lights) 多光源渲染技术概览 #mermaid-svg-3L5e5gGn76TNh7Lq {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-3L5e5gGn76TNh7Lq .error-icon{fill:#552222;}#mermaid-svg-3L5e5gGn76TNh7Lq .erro…...
JS设计模式(4):观察者模式
JS设计模式(4):观察者模式 一、引入 在开发中,我们经常会遇到这样的场景:一个对象的状态变化需要自动通知其他对象,比如: 电商平台中,商品库存变化时需要通知所有订阅该商品的用户;新闻网站中࿰…...
基于 TAPD 进行项目管理
起因 自己写了个小工具,仓库用的Github。之前在用markdown进行需求管理,现在随着功能的增加,感觉有点难以管理了,所以用TAPD这个工具进行需求、Bug管理。 操作流程 注册 TAPD,需要提供一个企业名新建一个项目&#…...
mac 安装homebrew (nvm 及git)
mac 安装nvm 及git 万恶之源 mac 安装这些东西离不开Xcode。及homebrew 一、先说安装git步骤 通用: 方法一:使用 Homebrew 安装 Git(推荐) 步骤如下:打开终端(Terminal.app) 1.安装 Homebrew…...
redis和redission的区别
Redis 和 Redisson 是两个密切相关但又本质不同的技术,它们扮演着完全不同的角色: Redis: 内存数据库/数据结构存储 本质: 它是一个开源的、高性能的、基于内存的 键值存储数据库。它也可以将数据持久化到磁盘。 核心功能: 提供丰…...
c# 局部函数 定义、功能与示例
C# 局部函数:定义、功能与示例 1. 定义与功能 局部函数(Local Function)是嵌套在另一个方法内部的私有方法,仅在包含它的方法内可见。 • 作用:封装仅用于当前方法的逻辑,避免污染类作用域,提升…...
