当前位置: 首页 > news >正文

四大自平衡树对比:AVL树、红黑树、B树与B+树

AVL树、红黑树、B树和B+树的对比与应用场景

树系列相关文章(置顶)

1、从链表到平衡树:二叉查找树的退化与优化
2、自平衡二叉查找树:如何让二叉查找树始终保持高效
3、AVL树入门:理解自平衡二叉查找树的基础
4、红黑树全解:概念、操作方法及常见应用
5、揭秘B树与B+树:如何保持高效的磁盘访问
6、四大自平衡树对比:AVL树、红黑树、B树与 B+树

引言

AVL树、红黑树、B树和B+树是四种常见的自平衡数据结构,广泛应用于计算机科学中。每种树都有其独特的特点和适用场景。本文将详细介绍这四种树的概念、特点,并通过表格形式对比它们的不同之处,最后探讨它们在实际应用中的区别。

在这里插入图片描述


1. 各种树的特点

1.1 AVL树

概念

AVL树(Adelson-Velsky and Landis Tree)是一种严格平衡的二叉查找树,通过限制每个节点左右子树的高度差不超过1来保持平衡。

特点
  • 高度严格平衡:每个节点左右子树的高度差不超过1。
  • 高效查找:由于严格的平衡性,查找、插入和删除操作的时间复杂度均为 O ( log ⁡ n ) O(\log n) O(logn)
  • 频繁旋转:为了维持严格的平衡性,插入和删除操作可能需要较多的旋转操作。

1.2 红黑树

概念

红黑树(Red-Black Tree)是一种近似平衡的二叉查找树,通过着色规则和旋转操作确保树的高度接近对数级别 O ( log ⁡ n ) O(\log n) O(logn)

特点
  • 颜色属性:每个节点要么是红色,要么是黑色。
  • 相对宽松的平衡:允许一定程度的不平衡,但通过严格的着色规则保证整体平衡性。
  • 较少旋转:相比AVL树,红黑树的插入和删除操作所需的旋转次数较少。
  • 广泛应用:C++标准库中的std::mapstd::set通常使用红黑树实现。

1.3 B树

概念

B树(B-Tree)是一种多路查找树,每个节点可以包含多个键值和子节点指针,适合磁盘存储,减少磁盘I/O次数。

特点
  • 多路查找:每个节点可以有多个子节点。
  • 高度平衡:所有叶子节点位于同一层,确保树的高度接近对数级别 O ( log ⁡ n ) O(\log n) O(logn)
  • 高效磁盘访问:适合磁盘存储,减少磁盘I/O次数。
  • 内部节点存储数据:内部节点和叶子节点都可以存储数据记录。

1.4 B+树

概念

B+树(B±Tree)是一种改进的B树,主要特点是所有的数据记录都存储在叶子节点中,而非叶子节点只存储索引信息。

特点
  • 数据存储在叶子节点:所有数据记录都存储在叶子节点中,非叶子节点只存储索引信息。
  • 叶子节点链表:所有叶子节点通过指针连接成一个双向链表,支持高效的顺序扫描。
  • 高度平衡:所有叶子节点位于同一层,确保树的高度接近对数级别 O ( log ⁡ n ) O(\log n) O(logn)
  • 高效磁盘访问:适合磁盘存储,减少磁盘I/O次数。
  • 范围查询效率高:由于所有数据记录都在叶子节点中,B+树更适合范围查询和顺序扫描。

2. 对比汇总表

为了更清晰地对比AVL树、红黑树、B树和B+树的特点,我们整理了一个详细的表格。这个表格涵盖了每种树的关键特性,并突出了它们在不同应用场景中的优势。

特性AVL树红黑树B树B+树
高度平衡严格平衡(高度差不超过1)相对宽松的平衡高度平衡高度平衡
查找时间复杂度 O ( log ⁡ n ) O(\log n) O(logn) O ( log ⁡ n ) O(\log n) O(logn) O ( log ⁡ n ) O(\log n) O(logn) O ( log ⁡ n ) O(\log n) O(logn)
插入/删除复杂度 O ( log ⁡ n ) O(\log n) O(logn),频繁旋转 O ( log ⁡ n ) O(\log n) O(logn),较少旋转 O ( log ⁡ n ) O(\log n) O(logn) O ( log ⁡ n ) O(\log n) O(logn)
数据存储位置内部节点和叶子节点都存储数据内部节点和叶子节点都存储数据内部节点和叶子节点都存储数据只有叶子节点存储数据
范围查询效率较低较低较低较高,通过叶子节点链表
顺序扫描效率较低较低较低较高,通过叶子节点链表
磁盘I/O效率较高,减少读取次数较高,减少读取次数较高,减少读取次数较高,减少读取次数
内存占用较高,频繁旋转较低,较少旋转较高,内部节点也存储数据较低,只有叶子节点存储数据
适用场景实时系统、嵌入式系统通用场景、C++标准库std::map/set文件系统、数据库索引(高效磁盘访问)数据库索引、文件系统(范围查询和顺序扫描)
补充说明
  • 高度平衡:AVL树要求每个节点左右子树的高度差不超过1,而红黑树允许一定程度的不平衡,但通过严格的着色规则保证整体平衡性。B树和B+树则通过多路查找确保所有叶子节点位于同一层。

  • 查找时间复杂度:四种树的查找操作时间复杂度均为 O ( log ⁡ n ) O(\log n) O(logn),但由于AVL树的严格平衡性,它在查找方面表现尤为突出。

  • 插入/删除复杂度:AVL树由于需要频繁进行旋转以维持严格平衡,因此在插入和删除操作上可能会比红黑树消耗更多的时间。红黑树通过较少的旋转操作,在插入和删除时性能更优。

  • 数据存储位置:B树和AVL树、红黑树一样,内部节点和叶子节点都可以存储数据记录;而B+树只在叶子节点存储实际数据,非叶子节点仅作为索引使用。

  • 范围查询和顺序扫描效率:B+树的所有数据记录都存储在叶子节点中,并且这些叶子节点通过链表连接,因此在进行范围查询和顺序扫描时效率更高。

  • 磁盘I/O效率:B树和B+树设计之初就是为了优化磁盘I/O操作,它们可以减少磁盘访问次数,适用于大型数据集的存储和检索。

  • 内存占用:AVL树因为需要频繁调整结构,所以在内存管理上有较高的开销;相比之下,红黑树由于旋转次数较少,内存占用相对较低。B+树由于只在叶子节点存储数据,其内存利用率通常优于B树。


3. 应用场景的区别

3.1 AVL树的应用

  • 严格平衡需求:适用于需要严格平衡的场景,如某些特定的实时系统或嵌入式系统。
  • 频繁查找:由于严格的平衡性,查找操作非常高效,适用于查找频率高的场景。

3.2 红黑树的应用

  • 综合性能:红黑树在插入、删除和查找之间取得了较好的平衡,适合大多数通用场景。
  • 标准库实现:C++标准库中的std::mapstd::set通常使用红黑树实现。

3.3 B树的应用

  • 文件系统:如Linux的ext3/ext4文件系统。
  • 数据库索引:如MySQL的InnoDB存储引擎,适合需要高效磁盘访问的场景。

3.4 B+树的应用

  • 数据库索引:如MySQL的MyISAM存储引擎,特别适合范围查询和顺序扫描。
  • 文件系统:如NTFS文件系统。
  • 范围查询和顺序扫描:B+树更适合这些操作,因为所有数据记录都存储在叶子节点中,并且叶子节点通过链表连接。

4. 结论

AVL树、红黑树、B树和B+树各有其独特的优势和适用场景。选择哪种树取决于具体的应用需求:

  • AVL树:适用于需要严格平衡和高效查找的场景。
  • 红黑树:适用于综合性能要求较高的通用场景。
  • B树:适用于需要高效磁盘访问的文件系统和数据库索引。
  • B+树:适用于需要高效范围查询和顺序扫描的场景,特别是在数据库和文件系统中表现优异。

相关文章:

四大自平衡树对比:AVL树、红黑树、B树与B+树

AVL树、红黑树、B树和B树的对比与应用场景 树系列相关文章(置顶) 1、从链表到平衡树:二叉查找树的退化与优化 2、自平衡二叉查找树:如何让二叉查找树始终保持高效 3、AVL树入门:理解自平衡二叉查找树的基础 4、红黑树全…...

BUUCTF Pwn ciscn_2019_es_2 WP

1.下载 checksec 用IDA32打开 定位main函数 发现了个假的后门函数: 看看vul函数: 使用read读取 想到栈溢出 但是只有48个 只能覆盖EBP和返回地址 长度不够构造 所以使用栈迁移: 栈迁移需要用到leave ret 使用ROPgadget找地址: …...

MongoDb-mongosh-登录

本地登录 mongosh --username root --password xxx 参考:Connect to a Deployment - MongoDB Shell...

C语言day3:shell脚本

一、作业题3 使用数组求出当前目录下.sh文件的个数 二、作业题4 使用数组求家目录下文件的个数 三、思维导图...

微信小程序Uniapp

使用命令行创建项目(vuets) npx degit dcloudio/uni-preset-vue#vite-ts my-vue3-project然后用HBX打开项目 再安装依赖 npm i 再运行开发版本,生成dist目录 pnpm dev:mp-weixin 注意要设置APPid 再用微信小程序打开...

mongoTemplate的复杂组装条件查询

mongoTemplate不像SQL那么灵活,组装条件较为复杂。 如下演示了查询类似于 AND name ‘张三’ OR age 12 NOT birthday > 2024-12-31 这类结构的代码示例。 脑子里的范围图: 所有的AND锁定一个范围,再跟所有的OR组成的范围取并集&#…...

httpslocalhostindex 配置的nginx,一刷新就报404了

当你的Nginx配置导致页面刷新时报404错误时,通常是由于以下几个原因造成的: 静态文件路径配置错误:Nginx没有正确地指向静态文件的目录。前端路由问题:如果是SPA(单页应用),刷新页面时Nginx没有…...

pandas删除值全部为0的整行和整列,还有0.0,0.000000也要删除

在 Pandas 中,如果需要删除全部为 0 的行或列,可以通过 .all() 方法来判断行或列是否所有元素都为 0,然后删除这些行或列。 代码示例 示例数据: import pandas as pd# 示例数据 data {A: [0, 2, 0, 4],B: [0, 0, 0, 0],C: [0, …...

IO Virtualization with Virtio.part 1 [十二]

久等了各位! 本篇开始讲解 IO 虚拟化中的 virtio,我会以 Linux 的 IIC 驱动为例,从 IIC 驱动的非虚拟化实现,到 IIC 驱动的半虚拟化实现,再到最后 X-Hyper 中如何通过 virtio 来实现前后端联系,一步步把 v…...

ShardingSphere-Proxy分表场景:go测试案例

接续上篇文章《ShardingSphere-Proxy分表场景测试案例》 go测试用例: package mainimport ("fmt""math/rand""time""github.com/bwmarrin/snowflake""gorm.io/driver/mysql""gorm.io/gorm""gor…...

OpenStack系列第四篇:云平台基础功能与操作(Dashboard)

文章目录 1. 镜像(Image)添加镜像查看镜像删除镜像 2. 卷(Volume)创建卷查看卷删除卷 3. 网络(虚拟网络)创建网络查看网络删除网络 4. 实例类型创建实例类型查看实例类型删除实例类型 4. 密钥对&#xff08…...

ESP32 I2S音频总线学习笔记(一):初识I2S通信与配置基础

文章目录 简介为什么需要I2S?关于音频信号采样率分辨率音频声道 怎样使用I2S传输音频?位时钟BCLK字时钟WS串行数据SD I2S传输模型I2S通信格式I2S格式左对齐格式右对齐格式 i2s基本配置i2s 底层API加载I2S驱动设置I2S使用的引脚I2S读取数据I2S发送数据卸载…...

25上半年软考高级系统分析师易混淆知识点

第1章 系统工程与信息系统基础 易混淆点1:系统工程生命周期与信息系统的生命周期 1、系统工程生命周期阶段 探索性研究→概念阶段→开发阶段→生产阶段→使用阶段→保障阶段→退役阶段 2、信息系统的生命周期 产生阶段→开发阶段(单个系统开发&…...

采集JSON解析错误的修复

两段采集来的JSON格式: 一: {"hwgOnlineId":"554312", "jiwuChatId":"", "phoneCategoryId":"20006", "cuxiaoSeq":{voucherTitle:1,lh 二: {"pic":&q…...

Java中实现对象的深拷贝(Deep Copy)

在Java中实现对象的深拷贝(Deep Copy)意味着创建一个对象的副本,使得原对象和副本对象完全分离,对副本对象的任何修改都不会影响到原对象。以下是几种实现深拷贝的方法: 1. 手动实现深拷贝 对于自定义类,…...

位置编码-APE

Transformer 中的绝对位置编码 (以下由gpt 生成) Transformer 的绝对位置编码(Absolute Position Encoding, APE)是用于对序列数据中的位置信息进行建模的一种方法。在 Transformer 的架构中,输入数据(如句…...

MySQL有哪些锁?

1.MySQL有哪些锁? 全局锁表级锁 表锁元数据锁意向锁 行级锁 记录锁间隙锁临键锁临时意向锁 我了解的是MySQL的锁可以分为全局锁、表级锁、行级锁。 我比较熟悉的是表级锁和行级锁,如果我们对表结构进行修改时,MySQL就会对这个表结构加一个…...

Everything实现,快速搜索文件

最近编写NTFS文件实时搜索工具, 类似 Everything 这样, 翻阅了很多博客, 结果大致如下: 1.分析比较肤浅, 采用USN日志枚举来获取文件记录 速度一言难尽, 因为日志枚举的是全盘所有文件的所有日志, 记录比文件记录还多, 速度当然很慢, 还有的甚至于是 使用 DeviceIoControl 函数…...

[硬件] DELL BIOS 相关注意事项

前言 前段时间重装系统. DELL BIOS属实资料少, 又难用. 这里给出相关的注意事项, 并且配上图片. BIOS相关注意事项 进入BIOS ESC/F2/ F12. 都可以进入BIOS, 当进U盘的入Win PE系统时, 使用F12 效果更佳. 关闭安全模式 切换到Boot Configuration选项,将Secure Boot选项off选…...

Rocky Linux 下安装Liboffice

Rocky Linux下安装Liboffice。 Step1: 在桌面,单击击键盘的Window键,点击出现的白色software按钮图标; Step2: 输入lib,即可自动跳出libre Office, 进行安装; Step3: Have fun with Rocky Linux....

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...

python打卡day49

知识点回顾: 通道注意力模块复习空间注意力模块CBAM的定义 作业:尝试对今天的模型检查参数数目,并用tensorboard查看训练过程 import torch import torch.nn as nn# 定义通道注意力 class ChannelAttention(nn.Module):def __init__(self,…...

简易版抽奖活动的设计技术方案

1.前言 本技术方案旨在设计一套完整且可靠的抽奖活动逻辑,确保抽奖活动能够公平、公正、公开地进行,同时满足高并发访问、数据安全存储与高效处理等需求,为用户提供流畅的抽奖体验,助力业务顺利开展。本方案将涵盖抽奖活动的整体架构设计、核心流程逻辑、关键功能实现以及…...

Xshell远程连接Kali(默认 | 私钥)Note版

前言:xshell远程连接,私钥连接和常规默认连接 任务一 开启ssh服务 service ssh status //查看ssh服务状态 service ssh start //开启ssh服务 update-rc.d ssh enable //开启自启动ssh服务 任务二 修改配置文件 vi /etc/ssh/ssh_config //第一…...

质量体系的重要

质量体系是为确保产品、服务或过程质量满足规定要求,由相互关联的要素构成的有机整体。其核心内容可归纳为以下五个方面: 🏛️ 一、组织架构与职责 质量体系明确组织内各部门、岗位的职责与权限,形成层级清晰的管理网络&#xf…...

select、poll、epoll 与 Reactor 模式

在高并发网络编程领域,高效处理大量连接和 I/O 事件是系统性能的关键。select、poll、epoll 作为 I/O 多路复用技术的代表,以及基于它们实现的 Reactor 模式,为开发者提供了强大的工具。本文将深入探讨这些技术的底层原理、优缺点。​ 一、I…...

算法笔记2

1.字符串拼接最好用StringBuilder&#xff0c;不用String 2.创建List<>类型的数组并创建内存 List arr[] new ArrayList[26]; Arrays.setAll(arr, i -> new ArrayList<>()); 3.去掉首尾空格...

Hive 存储格式深度解析:从 TextFile 到 ORC,如何选对数据存储方案?

在大数据处理领域&#xff0c;Hive 作为 Hadoop 生态中重要的数据仓库工具&#xff0c;其存储格式的选择直接影响数据存储成本、查询效率和计算资源消耗。面对 TextFile、SequenceFile、Parquet、RCFile、ORC 等多种存储格式&#xff0c;很多开发者常常陷入选择困境。本文将从底…...

【从零学习JVM|第三篇】类的生命周期(高频面试题)

前言&#xff1a; 在Java编程中&#xff0c;类的生命周期是指类从被加载到内存中开始&#xff0c;到被卸载出内存为止的整个过程。了解类的生命周期对于理解Java程序的运行机制以及性能优化非常重要。本文会深入探寻类的生命周期&#xff0c;让读者对此有深刻印象。 目录 ​…...

day36-多路IO复用

一、基本概念 &#xff08;服务器多客户端模型&#xff09; 定义&#xff1a;单线程或单进程同时监测若干个文件描述符是否可以执行IO操作的能力 作用&#xff1a;应用程序通常需要处理来自多条事件流中的事件&#xff0c;比如我现在用的电脑&#xff0c;需要同时处理键盘鼠标…...