当前位置: 首页 > news >正文

堆的概念和结构以及堆排序

前言

普通的二叉树是不适合用数组来存储的,因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结 构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储,需要注意的是这里的堆和操作系统 虚拟进程地址空间中的堆是两回事,一个是数据结构,一个是操作系统中管理内存的一块区域分段。

堆的概念及结构

**堆(数据结构)**在逻辑上是一个完全二叉树而在物理上是一个数组。

是一种顺序存储结构(采用数组方式存储),仅仅是利用完全二叉树的顺序结构的特点进行分析。
已知二叉树根结点的下标是root,那么它左孩子的下标left=2*root+1,右孩子的下标right=2*root+2
已知孩子结点的下标(不区分左右)为child,那么双亲的下标为(child-1)/2。

将满足根的值小于等于所有子树结点的值,称为小堆;根的值大于等于所有子树结点的值称为大堆

在这里插入图片描述

堆的实现

我们实现堆还是要用三个文件,来让堆的代码看起来更加的简单易懂,
test.c,用来让测试堆的代码
Heap.c,我们些堆的函数
Heap.h,包括堆函数的头文件

(1)创建一个堆

这就是用一个结构体将这些内容,包括起来。
还是很简单的就不多介绍了

typedef int HPDatatype;
typedef struct Heap
{HPDatatype* a;int sz;int capacity;
}HP;

(2).堆的初始化

//堆的初始化
void HeapInit(HP* php)
{assert(php);php->a = NULL;php->sz = 0;php->capacity = 0;
}

(2)堆的销毁

我们用malloc申请了空间,我们就要销毁。

//堆的销毁
void HeapDestory(HP* php)
{assert(php);free(php->a);php->a = NULL;php->sz = 0;php->capacity = 0;
}

(3).打印堆

//打印堆
void HeapPrint(HP* php)
{assert(php);for (int i = 0; i < php->sz; i++){printf("%d ", php->a[i]);}printf("\n");
}

(4)堆的添加元素

我们堆添加元素的思路,就是在数组的最后一位添加元素,然后看他的父节点是不是比他大或者小(创建大堆和创建小堆),如果是大堆,父节点比他小,就交换,然后知道最后交换到头结点。

这时我们就用到一种算法,叫做向上调整算法。

向上调整算法

//向上调整函数
void AdjustUp(HPDatatype* a,int child)
{int parent = (child - 1) / 2;while (child > 0){if (a[child] < a[parent]){Swap(&a[child], &a[parent]);child = parent;parent = (child - 1) / 2;}else{break;}}
}

交换函数

j进行数据的交换,因为后面用的会很多,就做成一个函数

//交换函数
void Swap(HPDatatype* p1,HPDatatype* p2)
{int tmp = *p1;*p1 = *p2;*p2 = tmp;
}

添加堆元素的代码

//堆的添加元素
void HeapPush(HP* php, HPDatatype x)
{assert(php);//扩容if (php->sz == php->capacity){int newcapacity = php->capacity == 0 ? 4 : php->capacity * 2;HPDatatype* tmp = (HPDatatype*)realloc(php->a, sizeof(HPDatatype) * newcapacity);if (tmp == NULL){perror("realloc");exit(-1);}php->a = tmp;php->capacity = newcapacity;}php->a[php->sz] = x;php->sz++;//向上调整函数AdjustUp(php->a,php->sz-1);
}

(5)删除堆顶的元素

我们堆删除元素,都是删除堆顶的元素,那么怎么删除元素了,
我们数组,最好删除的元素就是尾删,所以我们将第一个 元素和最后一个元素交换,然后我们sz--.

然后我们要保持他是一个堆,用到一个向下调整算法。

这个算法就是将最上面的元素,和他的最大的子节点进行交换,然后在进行到最后。

向下调整算法

void AdjustDown(HPDatatype* a, int n, int  parent)
{//选大的子节点进行交换int child = parent * 2 + 1;while (child < n){//确认child指向大的孩子if (child + 1 < n && a[child + 1] < a[child]){child++;}//孩子大于父亲,就进行交换,继续向下调整//孩子小于父亲,则调整结束if (a[child] < a[parent]){Swap(&a[child], &a[parent]);parent = child;child = parent * 2 + 1;}else{break;}}

删除元素的框架

//删除堆顶的数据,并保持他还是一个堆、
void HeapPop(HP* php)
{assert(php);assert(php->sz);//第一个和最后一个交换然后尾删Swap(&php->a[0], &php->a[php->sz - 1]);php->sz--;AdjustDown(php->a, php->sz, 0);
}

(6)找堆顶的元素

//找堆顶的元素
HPDatatype* HeapTop(HP* php)
{assert(php);assert(php->sz > 0);return php->a[0];
}

(7)查看堆的大小

//查看堆的大小
int HeapSize(HP* php)
{assert(php);return php->sz;
}

(8)判断堆是否为空

//判断堆是否为空
bool HeapEmpty(HP* php)
{assert(php);return php->sz==0;
}

堆的构建

我们堆的构建用的算法是我们在删除元素的时候向下调整算法。

在排序之前,我们需要做一个准备工作,将数组放进去。看下面代码。

//堆的构建
void HeapCreate(HP* php, HPDatatype* a, int n)
{assert(php);//创建空间,将数组的的内容拷贝到我们的堆中,然后zaiphp->a = (HPDatatype*)malloc( sizeof(HPDatatype) * n);if (php->a == NULL){perror("realloc");exit(-1);}memcpy(php->a, a, sizeof(HPDatatype)*n);php->sz = php->capacity = n;}

经过上面的操作,我们将一个无序的数组放进去了,但是现在数组的内容并不是一个堆,现在我们用两种算法将这个数组变成堆。

向下调整的建堆算法

思路就是:我们想将最后一个叶子结点和他的父节点,先构成一个堆,然后我们再将父节点的上一个结点的子节点,将这个构建一个堆,知道最后到根结点。看下面我画的解释图。

在这里插入图片描述

向下调整的建堆算法构建一个堆的代码

n表示这个数组有几个元素,而i表示我们的最后一个结点的父节点,然后就可以依次向下排序了,

//建堆算法for (int i = (n - 1 - 1) / 2; i >= 0; i--){AdjustDown(php->a, n, i);}

堆排序

我们想要堆排序,首先我们就要建堆,有了堆我们才可以排序,所以我们怎么将一个数组变成一个堆呢?
首先有两种方法,
1.第一种就是用插入的思想,将每一个数一个一个插进去,这时就要用我们的向上调整算法。
2.第二种方法就是用我们的上面用向下调整算法的思想建堆

向上调整算法建堆

其实这个思想就是将我们的每一个数插入堆的方法,肯定大家又点不理解,下来画个图,大家就理解了

在这里插入图片描述

<1>向上调整算法建堆代码

就是如此的简单,将每个数遍历遍,依次使用建堆算法就ok了。

	//向上调整建堆for (int i = 1; i < n; i++){AdjustUp(a, i);}

<2>向上调整建堆的时间复杂度

我们向上调整算法将每个数遍历一遍,然后将每个数的都要进行向上调整算法,我们就可以通过计算算,高度为h,
第一层不需要调整,
第二层开始调整,第二层有212^121个元素,每个再向上调整中进行了一次调整。
第三层有222^222,每个数最多调整2次
依次类推,在第n层,有2h−12^{h-1}2h1个元素,每个元素换h-1次。

所以可以算出
f(h)=21∗1+22∗2+23∗3……2h−1∗(h−1)f(h)=2^1*1+2^2*2+2^3*3……2^{h-1}*(h-1)f(h)=211+222+233……2h1(h1)
然后我们又知道N和h的关系,N=2h−1N=2^h-1N=2h1

算所有的太复杂,所以我们直接算最后一个,因为最后一层的结点最多,而且调整次数最多,可以代表整个的时间复杂度将h换成N。
F(N)≈((N+1)(log2(N+1)−1))/2F(N)≈((N+1)(log_2(N+1)-1))/2F(N)((N+1)(log2(N+1)1))/2
所以我们可以算出他的时间复杂对是O(N∗log2(N))O(N*log_2(N))O(Nlog2(N))

向下调整算法建堆

我们在堆的构建用的就是向下调整算法,思路和代码都讲了,但是我们为什们用向下调整算法,等我们算完下面的时间复杂度就知道。

<1>向下调整算法的时间复杂度

有的同学,看都不看,看到了两个循环,直接就说他的时间复杂度是O(N2N^2N2),这样都是打错特错了

首先分析一下,因为我们是从我们的最后一个数的父节点才开始算,我们的最后的叶子结点就不进行计算,而且我们想一下,我们的最多的结点不算,这种算法,一看这个时间复杂度就可以。
所以我们的最后一层没有进行堆排,
在我们的倒数第二层就进行一次调整
在倒数第三层进行2次调整
所以依次类推,第一层就进行h-1次调整

所以就可以计算
F(h)=2h−2∗1+2h−3∗2……22∗(h−2)+21∗(h−1)F(h)=2^{h-2}*1 + 2^{h-3}*2……2^2*(h-2)+2^1*(h-1)F(h)=2h21+2h32……22(h2)+21(h1)

所以我们可以看出这是一个等差数列*等比数列,用一个错位相减法我们就可以算出F(h)=2h−1−hF(h)=2^h-1-hF(h)=2h1h
我们又知道N=2h−1N=2^h-1N=2h1,将h换成N就可以得到。
所以可以得出F(h)=N−log2(N+1)F(h)=N-log_2(N+1)F(h)=Nlog2(N+1)
所以他的时间复杂度就是O(N).

比较两种算法

我们比较算法就是通过时间复杂度和空间复杂度进行比较,我们很容易就比较出来了,明显是向下调整算法好。他的时间复杂度底。

其实这个我们也可以通过画思路图就可以看明白了,
在向上调整算法中,我们的最后的结点最多,并且向上进行最多次,
而在向下调整算法中,我们最后一层的结点都不进行排序,并且在倒数第二层最多的结点才进行一次,而到了最高层最少的结点进行最多次。

如果我们要升序,建大堆还是建小堆

首先先说答案:建大堆
思路:为什们建大堆,我们大堆的头就是最大的数,这是无容置疑的,然后我们将最大的数和堆最后一个数进行交换,我们的再用向下调整算法调整堆不包括最后一个最大的数,(利用我们堆的删除的思路)知道我们的堆就剩下一个。

	for (int i = 0; i < n; i++){Swap(&a[0], &a[n - 1 - i]);AdjustDown(a, n - 1 -i, 0);}

这就是我们的堆排序

堆排序的时间复杂度

先说答案O(N∗log2(N))O(N*log_2(N))O(Nlog2(N))

可以类比一下,我们的向上调整算法,我们的最后一层是最多的一层,同时进行向下调整的次数也是最多的,所以我们直接算最后一层的就可以了,
而最后一层的个数是N=2h−1N=2^{h-1}N=2h1,向下调整算法的时间复杂度为O(N)O(N)O(N),
最后看F(h)=2h−1∗(h−1)F(h)=2^{h-1}*(h-1)F(h)=2h1(h1)次然后进行换算一下,
O(N∗log2(N))O(N*log_2(N))O(Nlog2(N))

Top-K问题

什们是Top-K问题?
即求数据结合中前K个最大的元素或者最小的元素,一般情况下数据量都比较大。
解决方法
  1. 用数据集合中前K个元素来建堆
    前k个最大的元素,则建小堆,
    前k个最小的元素,则建大堆
  1. 用剩余的N-K个元素依次与堆顶元素来比较,
    不满足则替换堆顶元素将剩余N-K个元素依次与堆顶元素比完之后,
    堆中剩余的K个元素就是所求的前K个最小或者最大的元素

时间复杂度:K+(N−K)∗logkK+(N-K)*logkK+(NK)logk=>O(N∗logk)O(N*logk)O(Nlogk)
空间复杂度:O(K)

相关文章:

堆的概念和结构以及堆排序

前言 普通的二叉树是不适合用数组来存储的&#xff0c;因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结 构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储&#xff0c;需要注意的是这里的堆和操作系统 虚拟进程地址空间中的堆是两回事&#xff0c…...

【Linux学习笔记】1.Linux 简介及安装

前言 本章介绍Linux及其安装方法。 Linux 简介 Linux 内核最初只是由芬兰人林纳斯托瓦兹&#xff08;Linus Torvalds&#xff09;在赫尔辛基大学上学时出于个人爱好而编写的。 Linux 是一套免费使用和自由传播的类 Unix 操作系统&#xff0c;是一个基于 POSIX 和 UNIX 的多…...

代码练习2~

在一个二维数组中&#xff08;每个一维数组的长度相同&#xff09;&#xff0c;每一行都按照从左到右递增的顺序排序&#xff0c;每一列都按照从上到下递增的顺序排序。请完成一个函数&#xff0c;输入这样的一个二维数组和一个整数&#xff0c;判断数组中是否含有该整数。def …...

微信小程序 之 云开发

一、概念1. 传统开发模式2. 新开发模式 ( 云开发模式 )3. 传统、云开发的模式对比4. 传统、云开发的项目流程对比5. 云开发的定位1. 个人的项目或者想法&#xff0c;不想开发服务器&#xff0c;直接使用云开发2. 某些公司的小程序项目是使用云开发的&#xff0c;但是不多&#…...

程序员的三门课,学习成长笔记

最近是有了解到一本好书&#xff0c;叫做程序员的三门课在这本书的内容当中我也确实汲取到了很多前辈能够传达出来的很多关于程序员职业规划以及成长路线上的见解&#xff0c;令我受益匪浅&#xff0c;故此想要把阅读完的每一章节结合自己的工作经验做一个精细化的小结&#xf…...

[技术经理]01 程序员最优的成长之路是什么?

00前言 谈起程序员的职业规划&#xff0c;针对大部分的职场人士&#xff0c;最优的成长之路应该是走技术管理路线&#xff0c;而不是走技术专家路线。 01关键的一步 中国自古就有“学而优则仕”的传统&#xff0c;发展到今天&#xff0c;在我们的现代企业里面&#xff0c;尤…...

linux集群技术(三)--七层负载均衡-nginx

nginx特点nginx优势、缺点生产架构nginx 7层负载均衡语法示例nginx负载均衡算法测试案例生产案例 1.nginx特点 1. 功能强大,性能卓越,运行稳定。 2. 配置简单灵活。 3. 能够自动剔除工作不正常的后端服务器。 4. 上传文件使用异步模式。client---nginx---web1 web2 web3 lvs同…...

阿里云物联网平台设备模拟器

在使用阿里云物联网平台过程中&#xff0c;如果开始调试没有实际的物理设备&#xff0c;可以考虑在阿里云物联网平台使用官方自带的模拟器进行调试。不过也可以通过叶帆科技开发的阿里云物联网平台设备模拟器AliIoTSimulator进行调试&#xff0c;AliIoTSimulator可以独立运行&a…...

docker全解

目录说明docker简介为什么是docker容器与虚拟机比较容器发展简史传统虚拟机技术容器虚拟化技术docker能干什么带来技术职级的变化开发/运维&#xff08;Devops)新一代开发工程师Docker应用场景why docker&#xff1f;docker的优势docker和dockerHub官网Docker安装CentOS Docker…...

Vue3 基础

Vue3 基础 概述 Vue (发音为 /vjuː/&#xff0c;类似 view) 是一款用于构建用户界面的 JavaScript 框架。它基于标准 HTML、CSS 和 JavaScript 构建&#xff0c;并提供了一套声明式的、组件化的编程模型&#xff0c;帮助你高效地开发用户界面。无论是简单还是复杂的界面&…...

【Linux】冯.诺依曼体系结构与操作系统

环境&#xff1a;centos7.6&#xff0c;腾讯云服务器Linux文章都放在了专栏&#xff1a;【Linux】欢迎支持订阅&#x1f339;冯.诺依曼体系结构什么是冯诺依曼体系结构&#xff1f;我们如今的计算机比如笔记本&#xff0c;或者是服务器&#xff0c;基本上都遵循冯诺依曼体系结构…...

WSO2 apim 多租户来区分api

WSO2 apim 多租户来区分api1. Tenant1.1 Add new tenant1.2 Add Role/User1.3 Published Api2. Delete Teant3. AwakeningWSO2安装使用的全过程详解: https://blog.csdn.net/weixin_43916074/article/details/127987099. Official Document: Managing Tenants. 1. Tenant 1.1 …...

TodoList(Vue前端经典项目)

TodoList主要是包含了CRUD功能&#xff0c;本地存储功能&#xff08;loaclStorage&#xff09;总结&#xff1a;全选按纽可以通过forEach循环来讲数据中的isCheck中的false删除实现就通过传递id&#xff0c;然后根据filter循环将符合条件的数据返回成数组&#xff0c;然后将返回…...

【扫盲】数字货币科普对于完全不了解啥叫比特币的小伙伴需要的聊天谈资

很多人并不清楚&#xff0c;我们时常听说的比特币&#xff0c;以太坊币&#xff0c;等等这些东西到底是一场骗局还是一场货币革命&#xff1f; 下面就围绕这数字货币的历史以及一些应用场景开始分析这个问题。 一、 开端 一切从2008年中本聪&#xff08;Satoshi Nakamoto&…...

算法学习笔记:双指针

前言&#xff1a; 用于记录总结刷题过程中遇到的同类型问题 双指针问题及用法总结 1. 总结 双指针常用于遍历连序性对象&#xff08;如数组、链表等&#xff09;时&#xff0c;使用两个或多个指针进行单向遍历及相应的操作。避免多层循环&#xff0c;降低算法的时间复杂度。 …...

C++类的静态成员总结

tags: C OOP 引子: 类为什么需要静态成员 有时候类需要与它的一些成员与类本身直接相关, 而不是与类的各个对象都保持关联, 这就减少了成员与每一个类的实例对象的联系, 从而降低资源占用. 另一方面, 如果每次都需要重新更新该成员, 使得对象使用新的值, 这时候只需要修改一份…...

二、并发编程的三大特性

文章目录并发编程的三大特性1、原子性什么是并发编程的原子性&#xff1f;保证并发编程的原子性synchronizedCASLock锁ThreadLocal2、可见性什么是可见性?解决可见性的方式volatilesynchronizedLockfinal3、有序性什么是有序性?as-if-serialhappens-beforevolatile并发编程的…...

Ubuntu 22.04.2 LTS安装Apollo8.0

本人硬件环境&#xff1a; CPU&#xff1a;Intel Core i7 6700 显卡&#xff08;GPU&#xff09;&#xff1a;NVIDIA GTX 3080 10G 内存&#xff1a;SAMSUNG DDR4 32GB 硬盘&#xff1a;双SSD系统盘 2T,双系统&#xff08;windows,ubuntu&#xff09; 一、安装Ubuntu 22.04…...

提高转化率的 3 个客户引导最佳实践

如果您的试用客户没有转化为付费客户&#xff0c;或者您总体上正在努力解决试用到付费转化率&#xff0c;那么您来对地方了。本文的最终目标是向您展示一些可用于提高自己的激活率和整体试用到付费转化的最佳客户引导实践。SaaS公司目前生活在一个以产品为主导的增长时代。换句…...

【消费战略】解读100个食品品牌丨元气森林 6年百亿的饮品黑马成功之道

元气森林成立于2016年&#xff0c;短短六年时间取得了近百亿营收的奇迹&#xff0c;成为让可口可乐、百事、娃哈哈、农夫山泉等消费巨头都无法忽视的对手。六年的成长堪比行业前辈20多年的积累&#xff0c;从这个角度而言&#xff0c;塔望咨询认为元气森林是成功的&#xff0c;…...

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…...

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…...

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…...

R语言AI模型部署方案:精准离线运行详解

R语言AI模型部署方案:精准离线运行详解 一、项目概述 本文将构建一个完整的R语言AI部署解决方案,实现鸢尾花分类模型的训练、保存、离线部署和预测功能。核心特点: 100%离线运行能力自包含环境依赖生产级错误处理跨平台兼容性模型版本管理# 文件结构说明 Iris_AI_Deployme…...

家政维修平台实战20:权限设计

目录 1 获取工人信息2 搭建工人入口3 权限判断总结 目前我们已经搭建好了基础的用户体系&#xff0c;主要是分成几个表&#xff0c;用户表我们是记录用户的基础信息&#xff0c;包括手机、昵称、头像。而工人和员工各有各的表。那么就有一个问题&#xff0c;不同的角色&#xf…...

视频字幕质量评估的大规模细粒度基准

大家读完觉得有帮助记得关注和点赞&#xff01;&#xff01;&#xff01; 摘要 视频字幕在文本到视频生成任务中起着至关重要的作用&#xff0c;因为它们的质量直接影响所生成视频的语义连贯性和视觉保真度。尽管大型视觉-语言模型&#xff08;VLMs&#xff09;在字幕生成方面…...

新能源汽车智慧充电桩管理方案:新能源充电桩散热问题及消防安全监管方案

随着新能源汽车的快速普及&#xff0c;充电桩作为核心配套设施&#xff0c;其安全性与可靠性备受关注。然而&#xff0c;在高温、高负荷运行环境下&#xff0c;充电桩的散热问题与消防安全隐患日益凸显&#xff0c;成为制约行业发展的关键瓶颈。 如何通过智慧化管理手段优化散…...

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上&#xff0c;所以报错&#xff0c;到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本&#xff0c;cu、torch、cp 的版本一定要对…...

自然语言处理——循环神经网络

自然语言处理——循环神经网络 循环神经网络应用到基于机器学习的自然语言处理任务序列到类别同步的序列到序列模式异步的序列到序列模式 参数学习和长程依赖问题基于门控的循环神经网络门控循环单元&#xff08;GRU&#xff09;长短期记忆神经网络&#xff08;LSTM&#xff09…...

RNN避坑指南:从数学推导到LSTM/GRU工业级部署实战流程

本文较长&#xff0c;建议点赞收藏&#xff0c;以免遗失。更多AI大模型应用开发学习视频及资料&#xff0c;尽在聚客AI学院。 本文全面剖析RNN核心原理&#xff0c;深入讲解梯度消失/爆炸问题&#xff0c;并通过LSTM/GRU结构实现解决方案&#xff0c;提供时间序列预测和文本生成…...