当前位置：首页 > news >正文

数据结构(四) B树/跳表

news 2026/5/30 5:08:27

1. LRU

2. B树

3. 跳表

1. LRU:

1.1 概念:

最近最少使用算法, 就是cache缓存的算法. 因为cache(位于内存和cpu之间的存储设备)是一种容量有限的缓存, 有新的数据进入就需要将原本的数据进行排出.

1.2 LRU cache实现:

#include <iostream>
#include <list>
#include <unordered_map>using namespace std;class LRUCache
{
public:LRUCache(int capacity){_capacity = capacity;}//获取数据.int get(int key){//找到数据key的值.auto hashit = _hashmap.find(key);if(hashit != _hashmap.end()){//找到对应关键词auto listit = hashit->second;pair<int, int> kv = *listit;//删除原来对应关键词数据;_list.erase(listit);//现在头插关键词数据._list.push_front(kv);//然后改变一下hashmap的key的值.._hashmap[key] = _list.begin();return kv.second;}else{return -1;}}//插入新的数据.key,value类型的.void put(int key, int value){auto hashit = _hashmap.find(key);if(hashit == _hashmap.end()){//找不到对应的数据;if(_list.size() >= _capacity){//大于容量._hashmap.erase(_list.back().first);//删除最后一个数据.(这个数据很久没访问过的);_list.pop_back();}_list.push_front(make_pair(key, value));_hashmap[key] = _list.begin();}else{auto listit = hashit->second;pair<int, int> kv = *listit;kv.second = value;_list.erase(listit);_list.push_front(kv);_hashmap[key] = _list.begin();}}private://链表保存各个cache里的数据.list<pair<int, int>> _list;size_t _capacity;//使用下标和cache数据指针进行映射.unordered_map<int, list<pair<int, int>>::iterator> _hashmap;
};

2. B树:

2.1 常见的搜索结构:

顺序查找O(N), 二分查找O(logN), 二叉搜索树O(N), 二叉平衡树O(logN), 哈希O(1);

这些查找算法只能在数据量比较少, 以及内存可以一次进行寻找的, 如果数据量很大, 那么数据一次无法放到内存只能在磁盘中. 那么内存和磁盘进行交互的话时间就比较慢.

2.2 B树的概念:

一种平衡多叉树, 可以进行外查找的. 一棵M阶多叉树, 是一个平衡M路的平衡多叉树.满足性质:

(1) 根结点至少有两个孩子;

(2) 每个分支结点都包含k-1个关键字和k个孩子. 其中k的取值在[m/2, m]之间.

(3) 每个叶子结点都包含k-1个关键词; k的取值[m/2, m];

(4) 叶子结点都在一层, (5) 每个结点从小到大排序.

2.3 B树的插入分析:

下面拿三叉树来举例, M = 3, 那么每个结点可以最多存储2个数据(k范围[1, 3), k-1个关键词; 孩子的话永远比数据多一个, 就是3个孩子.

插入数据74, 49, 139, 145, 36, 53的过程. 如果结点满就需要分裂.

2.4 B树的实现:

(1) 结构:

采用一个关键词数组以及存放关键词的孩子结点, 还有一个保存关键词的父亲结点.

//类型为k, 数量为M.
//M层数.
template<class K, size_t M>
struct BTreeNode
{//创建关键词数组; 以及相对应的孩子结点.K _keys[M];//孩子结点的指针.BTreeNode<K, M>* _subs[M+1];BTreeNode<K, M>* _parent;//记录存储关键字数.size_t _n;BTreeNode(){for(size_t i = 0; i < M; i++){_keys[i] = K();_subs[i] = nullptr;}_subs[M] = nullptr;_parent = nullptr;_n = 0;}
};template<class K, size_t M>
class BTree
{typedef BTreeNode<K, M> Node;private:Node* _root = nullptr;
};

(2) 查找:

//查找数据:pair<Node*, int> Find(const K& key){Node* parent = nullptr;Node* cur = _root;//遍历B树结点.while(cur){size_t i = 0;while(i < cur->_n){//小于关键词不存在.if(key < cur->_keys[i]){break;}//大于就在右边.else if(key > cur->_keys[i]){i++;}else{//相等返回cur结点以及下标位置.return make_pair(cur, i);}}//本关键词找不到就到另外一个关键词查看.parent = cur;cur = cur->subs[i];}//找不到就返回空.return make_pair(parent, -1);}

(3) 插入关键字:

如果满了首先找到中间结点, 中间结点的后面结点移动新结点, 然后中间结点放到parent数组中.

//

(4) 遍历关键词:

遍历每个结点的孩子结点, 先左子树, 再根, 后右子树即可.

    void _InOrder(Node* cur){if(cur == nullptr)return;size_t i = 0;for(; i < cur->_n; i++){//先遍历左子树._InOrder(cur->_subs[i]);//打印根子树.cout << cur->_keys[i] << " ";}//再去遍历右子树._InOrder(cur->_subs[i]);}

(5) B树性能分析:

查找效率大概就是O(logM-1)到O(logm/2); 查询到结点就再使用二分查找很快就可以找到. l例如620亿个数据, 树的度是1024的话, 最多需要查询4次. 这样就可以减少磁盘io次数.

2.5 B+树:

在B树上做了些修改: (1) 分支节点的子树指针和关键字个数相同;

(2) 叶子结点增加一个连接指针将叶子结点连接在一起.

(3) 分支节点的子树指针p[i]指向关键字值大小在[k[i]，k[i+1])区间之间

(4) 所有关键字及其映射数据都在叶子节点出现

所有的关键字都出现在叶子结点的链表中, 并且有序;

不可能在分支结点命中, 分支结点相当与是叶子结点的索引, 叶子结点才是真正存储数据的.

B+树的增加只会改变原结点以及父结点, 因为将一半结点给兄弟结点, 源节点给父亲结点即可.

2.6 B*树:

B+树的变形, 增加非叶子结点和非根结点的链表指针.

B*树增加数据就要将看兄弟结点没满就将数据插入到兄弟结点中, 其次就是满的话将数据创建一个新的结点, 然后将1/3数据给新结点, 重新修改一下父结点的指向孩子的指针.

2.6 总结:

(1) B树: 有序数组和平衡多叉树;

(2) B+树: 有序数组链表和平衡多叉树;

(3) B*树: 一个饱满, 均匀, 空间利用率高的B+树.

2.7 B树的运用:

在MySQL中使用到索引, 高效获取数据的数据结构, 索引在于表, 而不是数据库.

(1) MyISAM: (非聚簇索引)

不支持事务, 支持全文索引, 叶子结点存放的是数据的地址. 包含主索引和辅助索引, 主索引的key不能重复, 辅助索引可以. 这种数据和索引不在一起的就是非聚簇索引.

(2) Innodb:

支持事务, 支持B+树索引、全文索引、哈希索引。它是将数据和索引存放在一起; 数据存储的是值不是地址, 这种就是聚簇索引.

3. 跳表:

3.1 概念:

数据结构(四) B树/跳表

目录 1. LRU 2. B树 3. 跳表 1. LRU: 1.1 概念: 最近最少使用算法, 就是cache缓存的算法. 因为cache(位于内存和cpu之间的存储设备)是一种容量有限的缓存, 有新的数据进入就需要将原本的数据进行排出. 1.2 LRU cache实现: #include <iostream> #include <list>…...

编程日记 2025/1/25 18:57:31

Arcgis国产化替代：Bigemap Pro正式发布

在数字化时代，数据如同新时代的石油，蕴含着巨大的价值。从商业决策到科研探索，从城市规划到环境监测，海量数据的高效处理、精准分析与直观可视化，已成为各行业突破发展瓶颈、实现转型升级的关键所在。历经十年精心打磨…...

编程日记 2025/1/25 18:56:30

LBS 开发微课堂｜AI向导接口服务：重塑用户的出行体验

为了让广大开发者更深入地了解百度地图开放平台的技术能力轻松掌握满满的技术干货更加简单地接入位置服务我们特别推出了 “位置服务（LBS）开发微课堂” 系列技术案例第六期的主题是《AI向导接口服务的能力与接入方案》随着地图应…...

编程日记 2025/1/25 18:50:24

AI导航工具我开源了利用node爬取了几百条数据

序言别因今天的懒惰，让明天的您后悔。输出文章的本意并不是为了得到赞美，而是为了让自己能够学会总结思考；当然，如果有幸能够给到你一点点灵感或者思考，那么我这篇文章的意义将无限放大。背景随着AI的发展市面上…...

编程日记 2025/1/25 18:46:21

openstack单机安装

openstack单机安装网卡配置安装依赖开启虚拟环境修改配置文件部署openstack部署openstack客户端访问可视化界面Horizon补充本篇主要讲述Ubuntu2204单机安装openstackstable/2024.2。其他版本的Linux系统或者openstack版本，请参考openstack官网。网卡配置需要配…...

编程日记 2025/1/25 18:42:16

Vue3实现小红书瀑布流布局任意组件动态更新页面方法实践

思路 1.首先定义一个瀑布流容器，它的高度暂定（后面会更新）。把需要布局的组件（这里叫做waterfall-item）放在瀑布流容器里面渲染出来。使用绝对定位（position: absolute），把它移到屏幕…...

编程日记 2025/1/25 18:39:08

深度学习项目--基于LSTM的糖尿病预测探究(pytorch实现)

🍨 本文为🔗365天深度学习训练营中的学习记录博客🍖 原作者：K同学啊前言 LSTM模型一直是一个很经典的模型，一般用于序列数据预测，这个可以很好的挖掘数据上下文信息，本文将使用LSTM进行糖尿病…...

编程日记 2025/1/25 18:37:06

Next.js 实战 (十)：中间件的魅力，打造更快更安全的应用

什么是中间件？ 在 Next.js 中，中间件（Middleware）是一种用于处理每个传入请求的功能。它允许你在请求到达页面之前对其进行修改或响应。通过中间件，你可以实现诸如日志记录、身份验证、重定向、CORS配置、压缩等任务…...

编程日记 2025/1/25 18:32:01

python+playwright自动化测试(四)：元素操作(键盘鼠标事件)、文件上传

目录鼠标事件悬停移动按键点击滚轮操作拖拽键盘事件输入文本内容 type输入内容 fill输入内容按键操作press 文件上传下拉选/单选框/复选框滚动条操作鼠标事件悬停 page.get_by_text(设置,exactTrue).nth(1).hover() 移动 page.mouse.move(x33…...

编程日记 2025/1/25 18:31:00

【论文+源码】Diffusion-LM 改进了可控文本生成

这篇论文探讨了如何在不重新训练的情况下控制语言模型（LM）的行为，这是自然语言生成中的一个重大开放问题。尽管近期一些研究在控制简单句子属性（如情感）方面取得了成功，但在复杂的细粒度控制（如…...

编程日记 2025/1/25 18:29:58

双目立体校正和Q矩阵

立体校正对两个摄像机的图像平面重投影，使二者位于同一平面，而且左右图像的行对准。 Bouguet 该算法需要用到双目标定后外参(R，T) 从上图中可以看出，该算法主要分为两步： 使成像平面共面这个办法很直观&#xff…...

编程日记 2025/1/25 18:22:46

vscode 自用插件

vscode按住ctrl鼠标左键无法跟踪跳转方法名，装这些插件就可以 vscode-elm-jump:常规的代码跳转定义 Vue CSS Peek:跳转css定义 vue-helper:变量函数只跳转定义 Vetur 代码提示 Baidu Comate 自动帮你写console.log Turbo Console Log: ctrl alt l 选中变量之后&am…...

编程日记 2025/1/25 18:18:42

OpenCV：在图像中添加高斯噪声、胡椒噪声

目录在图像中添加高斯噪声高斯噪声的特性添加高斯噪声的实现给图像添加胡椒噪声实现胡椒噪声的步骤相关阅读 OpenCV：图像处理中的低通滤波-CSDN博客 OpenCV：高通滤波之索贝尔、沙尔和拉普拉斯-CSDN博客 OpenCV：图像滤波、卷积与…...

编程日记 2025/1/25 18:11:34

DuckDB：Golang操作DuckDB实战案例

DuckDB是一个嵌入式SQL数据库引擎。它与众所周知的SQLite非常相似，但它是为olap风格的工作负载设计的。DuckDB支持各种数据类型和SQL特性。凭借其在以内存为中心的环境中处理高速分析的能力，它迅速受到数据科学家和分析师的欢迎。在这篇博文中&#xff0…...

编程日记 2025/1/25 18:10:26

MySQL入门（数据库、数据表、数据、字段的操作以及查询相关sql语法）

天行健，君子以自强不息；地势坤，君子以厚德载物。每个人都有惰性，但不断学习是好好生活的根本，共勉！ 文章均为学习整理笔记，分享记录为主，如有错误请指正，共同学习进步。…...

编程日记 2025/1/25 18:07:19

kotlin的协程的基础概念

Kotlin的协程是一种用于简化异步编程的强大工具。理解协程的基础概念可以帮助开发者有效地利用其能力。以下是Kotlin协程的一些关键基础概念： 协程（Coroutines） ： 协程是一种用于处理并发任务的编程模型，它可以在单…...

编程日记 2025/1/25 18:06:18

Spring--SpringMVC使用（接收和响应数据、RESTFul风格设计、其他扩展）

SpringMVC使用二.SpringMVC接收数据2.1访问路径设置2.2接收参数1.param和json2.param接收数据3 路径参数接收4.json参数接收 2.3接收cookie数据2.4接收请求头数据2.5原生api获取2.6共享域对象三.SringMVC响应数据3.1返回json数据ResponseBodyRestController 3.2返回静态资源…...

编程日记 2025/1/25 18:05:17

隐藏php版本信息x-powered-by

在生产环境中，并不想让别人知道用的是什么版本的php，可以把x-powered-by隐藏掉在nginx配置文件加上fastcgi_hide_header X-Powered-By; 如下图所示配置修改后平滑重启nginx...

编程日记 2025/1/25 18:04:16

哈夫曼树（构建、编码、译码）（详细分析+C++代码实现）

D 哈夫曼树题目要求编写一个哈夫曼编码译码程序。针对一段文本，根据文本中字符出现频率构造哈夫曼树，给出每个字符的哈夫曼编码，并进行译码，计算编码前后文本大小。为确保构建的哈夫曼树唯一，本题做如下限定&…...

编程日记 2025/1/25 18:01:13

C++ 二叉搜索树

目录概念性能分析二叉搜索树的插入二叉树的查找二叉树的前序遍历二叉搜索树的删除（重点） 完整代码 key与value的使用概念对于一个二叉搜索树若它的左子树不为空，则左子树上所有的节点的值都小于等于根节点的值若它的右子树不为空…...

编程日记 2025/1/25 18:00:11

艾尔登法环帧率解锁终极指南：告别卡顿，畅享丝滑游戏体验

艾尔登法环帧率解锁终极指南：告别卡顿，畅享丝滑游戏体验【免费下载链接】EldenRingFpsUnlockAndMore A small utility to remove frame rate limit, change FOV, add widescreen support and more for Elden Ring 项目地址: https://gitcode.com/gh_m…...

编程新知 2026/5/26 3:38:09

别再死记硬背了！用Multisim仿真+图解，5分钟搞懂三极管共射放大电路工作原理

用Multisim仿真图解5分钟掌握三极管共射放大电路三极管共射放大电路是电子技术中最基础也最关键的电路之一，但传统教材中复杂的公式推导和静态图解往往让初学者望而生畏。本文将带你用Multisim仿真软件，通过可视化的方式直观理解电路工作原理&#xff0c…...

编程新知 2026/5/26 3:32:09

Midjourney锐化效果失效真相（2024官方未公开的渲染管线瓶颈解析）

更多请点击： https://intelliparadigm.com 第一章：Midjourney锐化效果失效真相（2024官方未公开的渲染管线瓶颈解析） 自2024年V6.2版本起，大量用户反馈 --stylize 与 --sharp 参数组合下图像边缘锐化效果显著弱化&am…...

编程新知 2026/5/26 1:06:54

【DeepSeek开源协议识别权威指南】：20年合规专家亲授3大协议陷阱与5步精准识别法

更多请点击： https://intelliparadigm.com 第一章：DeepSeek开源协议识别的底层逻辑与合规价值 DeepSeek系列模型（如DeepSeek-V2、DeepSeek-Coder）虽以“开源”名义发布，但其实际许可状态需通过结构化协议解析才能准确…...

编程新知 2026/5/26 1:04:50

3步解锁网易云音乐NCM加密：让音乐真正属于你

3步解锁网易云音乐NCM加密：让音乐真正属于你【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为下载的网易云音乐只能在特定客户端播放而烦恼吗？当你精心收藏的歌曲被NCM格式"锁"在单一平台时&a…...

编程新知 2026/5/26 0:16:08

为你的Hermes Agent自定义Provider，接入Taotoken多模型池

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度为你的Hermes Agent自定义Provider，接入Taotoken多模型池在构建复杂的AI应用时，开发者常常面临一个核心挑…...

编程新知 2026/5/25 21:21:36

如何在3分钟内为任何活动搭建专业级滚动抽奖系统？Magpie-LuckyDraw全平台开源方案深度解析

如何在3分钟内为任何活动搭建专业级滚动抽奖系统？Magpie-LuckyDraw全平台开源方案深度解析【免费下载链接】Magpie-LuckyDraw 🏅A fancy lucky-draw tool supporting multiple platforms💻(Mac/Linux/Windows/Web/Docker) 项目地址: https…...

编程新知 2026/5/25 21:19:36