当前位置：首页 > news >正文

C++：探索哈希表秘密之哈希桶实现哈希

news 2026/5/13 1:52:28

在这里插入图片描述

文章目录

前言
一、链地址法概念
二、哈希表扩容
三、哈希桶插入逻辑
四、析构函数
五、删除逻辑
六、查找
七、链地址法代码实现总结

前言

前面我们用开放定址法代码实现了哈希表：
C++：揭秘哈希：提升查找效率的终极技巧_1

对于开放定址法来说，包含以下两种探测插入节点位置方法：

线性探测
二次探测

在这里插入图片描述

但是开放定址法的缺点也很明显，开放定址法容易很多数据堆积在一起，大大减少了效率。

为了解决上述问题，引入了第二种方法实现哈希表
——链地址法（哈希桶法）

一、链地址法概念

开放定址法中，所有的元素都放到哈希表里。

链地址法中，所有的数据不再直接存储在哈希表中。哈希表中存储一个指针，没有数据映射到这个位置时，这个指针为空；有多个数据映射到这个位置时，我们把这些冲突的数据链接成一个链表，挂在哈希表这个位置下面。链地址法也叫做拉链法或者哈希桶。

下⾯演⽰ {19,30,5,36,13,20,21,12,24,96} 等这⼀组值映射到M=11的表中。

在这里插入图片描述

二、哈希表扩容

开放定址法的负载因子必须小于 1，而链地址法的负载因子则没有限制，可以大于 1。

负载因子越大，哈希冲突的概率越高，空间利用率越高；负载因子越小，哈希冲突的概率越低，空间利用率越低。

STL 中 unordered_xxx 的最大负载因子基本控制在 1，当负载因子大于 1 时会扩容。我们下面的实现也使用这种方式。

也就是说，我们期望基本每个节点下面都挂一个桶，有那么一两个数据，如下图：

在这里插入图片描述

三、哈希桶插入逻辑

首先，如果不需要扩容，我们需要将一个节点挂上去，因为每一个哈希桶类似于链表，而链表的头插效率是十分高的，因此我们采用头插。

在这里插入图片描述

// 如果不需要扩容size_t hashi = hf(kv.first) % _table.size();// 头插Node* newnode = new Node(kv);newnode->_next = _table[hashi];_table[hashi] = newnode;++_n;return true;

其次，如果需要扩容的话，需要遍历_table取每一个哈希桶的每一个结点重新插入到新表，但是这样的话还牵扯到了旧表资源的释放。

因此我们使用顺手牵羊，直接将旧表的节点迁过来头插，解决资源释放的问题。

在这里插入图片描述

// 遍历旧表，顺手牵羊，把节点牵下来挂到新表for (size_t i = 0; i < _table.size(); i++){Node* cur = _table[i];while (cur){Node* next = cur->_next;// 头插到新表size_t newhashi = hf(cur->_kv.first) % newSize;cur->_next = newTable[newhashi];newTable[newhashi] = cur;cur = next;}_table[i] = nullptr;}_table.swap(newTable);}

四、析构函数

因为我们vector中存储的是自定义类型，因此我们需要显示写析构函数。

遍历整个哈希表，删除每一个节点，最后将其置空。

~HashTable(){for (size_t i = 0; i < _table.size(); i++){Node* cur = _table[i];while (cur){Node* next = cur->_next;delete cur;cur = next;}_table[i] = nullptr;}}

五、删除逻辑

删除就比较简单了，它分两种情况：

删除的值prev为空——直接删除它，把_table[i] = cur

在这里插入图片描述

删除的值prev不为空——涉及到前后的链接

在这里插入图片描述

bool Erase(const K& key){HashFunc hf;size_t hashi = hf(key) % _table.size();Node* cur = _table[hashi];Node* prev = nullptr;while (cur){if (cur->_kv.first == key){if (prev == nullptr){_table[hashi] = cur->_next;}else{prev->_next = cur->_next;}delete cur;return true;}else{prev = cur;cur = cur->_next;}}return false;}

六、查找

这里的查找比较简单，遍历整个_table就可以啦~
在这里插入图片描述

七、链地址法代码实现总结

#pragma once
#include<vector>namespace hash_bucket
{template<class K>struct DefaultHashFunc{size_t operator() (const K& key){return (size_t)key;}};template<>struct DefaultHashFunc<string>{size_t operator() (const string& str){// BKDRsize_t hash = 0;for (auto ch : str){hash *= 131;hash += ch;}return hash;}};template<class K, class V>struct HashData{pair<K, V> _kv;HashData<K, V>* _next;HashData(const pair<K, V>& kv): _kv(kv), _next(nullptr){}};template<class K, class V, class HashFunc = DefaultHashFunc<K>>class HashTable{typedef HashData<K, V> Node;public:HashTable(){_table.resize(10, nullptr);}~HashTable(){for (size_t i = 0; i < _table.size(); i++){Node* cur = _table[i];while (cur){Node* next = cur->_next;delete cur;cur = next;}_table[i] = nullptr;}}bool Insert(const pair<K, V>& kv){if (Find(kv.first)){return false;}// 仿函数控制HashFunc hf;// 如果需要扩容if (_n == _table.size()){size_t newSize = _table.size() * 2;vector<Node*> newTable;newTable.resize(newSize, nullptr);// 遍历旧表，顺手牵羊，把节点牵下来挂到新表for (size_t i = 0; i < _table.size(); i++){Node* cur = _table[i];while (cur){Node* next = cur->_next;// 头插到新表size_t newhashi = hf(cur->_kv.first) % newSize;cur->_next = newTable[newhashi];newTable[newhashi] = cur;cur = next;}_table[i] = nullptr;}_table.swap(newTable);}// 如果不需要扩容size_t hashi = hf(kv.first) % _table.size();// 头插Node* newnode = new Node(kv);newnode->_next = _table[hashi];_table[hashi] = newnode;++_n;return true;}Node* Find(const K& key){HashFunc hf;size_t hashi = hf(key) % _table.size();Node* cur = _table[hashi];while (cur){if (cur->_kv.first == key){return cur;}cur = cur->_next;}return nullptr;}bool Erase(const K& key){HashFunc hf;size_t hashi = hf(key) % _table.size();Node* cur = _table[hashi];Node* prev = nullptr;while (cur){if (cur->_kv.first == key){if (prev == nullptr){_table[hashi] = cur->_next;}else{prev->_next = cur->_next;}delete cur;return true;}else{prev = cur;cur = cur->_next;}}return false;}void Print(){for (size_t i = 0; i < _table.size(); i++){printf("[%d]->", i);Node* cur = _table[i];while (cur){cout << cur->_kv.first << ":" << cur->_kv.second << "->";cur = cur->_next;}printf("NULL\n");}cout << endl;}private:vector<Node*> _table;     // 指针数组size_t _n = 0;            // 存储了多少个有效数据};
}

到这里就结束啦，创作不易，如果对您有帮助的话，麻烦给一个一键三连，谢谢各位大佬~

在这里插入图片描述

C++：探索哈希表秘密之哈希桶实现哈希

文章目录前言一、链地址法概念二、哈希表扩容三、哈希桶插入逻辑四、析构函数五、删除逻辑六、查找七、链地址法代码实现总结前言前面我们用开放定址法代码实现了哈希表： C：揭秘哈希：提升查找效率的终极技巧_1 对于开放定址法来说&#…...

编程日记 2024/11/29 8:15:15

具身智能高校实训解决方案——从AI大模型+机器人到通用具身智能

一、行业背景在具身智能的发展历程中，AI 大模型的出现成为了关键的推动力量。这些大模型具有海量的参数和强大的语言理解、知识表示能力，能够为机器人的行为决策提供更丰富的信息和更智能的指导。然而，单纯的大模型在面对复杂多变的现实…...

编程日记 2024/11/29 8:14:07

【消息序列】详解(8)：探秘物联网中设备广播服务

目录一、概述 1.1. 定义与特点 1.2. 工作原理 1.3. 应用场景 1.4. 技术优势二、截断寻呼（Truncated Page）流程 2.1. 截断寻呼的流程 2.2. 示例代码 2.3. 注意事项三、无连接外围广播过程 3.1. 设备 A 启动无连接外围设备广播 3.2. 示例代…...

编程日记 2024/11/29 8:13:04

【RL Base】强化学习核心算法：深度Q网络（DQN）算法

📢本篇文章是博主强化学习（RL）领域学习时，用于个人学习、研究或者欣赏使用，并基于博主对相关等领域的一些理解而记录的学习摘录和笔记，若有不当和侵权之处，指出后将会立即改正，还望谅…...

编程日记 2024/11/29 8:12:02

深入浅出 Python 网络爬虫：从零开始构建你的数据采集工具

在大数据时代，网络爬虫作为一种数据采集技术，已经成为开发者和数据分析师不可或缺的工具。Python 凭借其强大的生态和简单易用的语言特点，在爬虫领域大放异彩。本文将带你从零开始，逐步构建一个 Python 网络爬虫，解决实…...

编程日记 2024/11/29 8:11:01

美国发布《联邦风险和授权管理计划 (FedRAMP) 路线图 (2024-2025)》

文章目录前言一、战略目标实施背景2010年12月，《改革联邦信息技术管理的25点实施计划》2011年2月，《联邦云计算战略》2011年12月，《关于“云计算环境中的信息系统安全授权”的首席信息官备忘录》2022年12月，《FedRAMP 授权法案》…...

编程日记 2024/11/29 8:10:00

Python语法基础（三）

🌈个人主页：羽晨同学 💫个人格言:“成为自己未来的主人~” 我们这篇文章来说一下函数的返回值和匿名函数函数的返回值我们先来看下面的这一段函数的定义代码 # 1、返回值的意义 def func1():print(111111111------start)num166print…...

编程日记 2024/11/29 8:08:58

云计算之elastaicsearch logstach kibana面试题

1.ELK是什么？ ELK 其实并不是一款软件，而是一整套解决方案，是三个软件产品的首字母缩写 Elasticsearch：负责日志检索和储存 Logstash：负责日志的收集和分析、处理 Kibana：负责日志的可视化这三款软件都是开源软件，通常是配合使用，而且又先后归于 Elastic.co 公司名下，…...

编程日记 2024/11/29 8:07:54

【已解决】git push需要输入用户名和密码问题

解决方法： 1）查看使用的clone方式： git remote -v 2）若为HTTPS，删除原clone方式: git remote rm origin 3）添加新的clone方式： git remote add origin gitgithub.com:zludon/git_test.git …...

编程日记 2024/11/29 8:05:51

python的字符串处理

需求： 编写一个程序，输入一段英文句子，统计每个单词的长度，并将单词按照长度从短到长排序。程序逻辑框图 1、用户输入一句英文句子。 2、对输入的句子进行预处理（去空格并分割为单词列表）。 3、统计每个单…...

编程日记 2024/11/29 8:03:49

【线程】Java多线程代码案例（2）

【线程】Java多线程代码案例（2） 一、定时器的实现1.1Java标准库定时器1.2 定时器的实现二、线程池的实现2.1 线程池2.2 Java标准库中的线程池2.3 线程池的实现一、定时器的实现 1.1Java标准库定时器 import java.util.Timer; import java.util.Timer…...

编程日记 2024/11/29 8:00:46

虚拟机之间复制文件

在防火墙关闭的前提下，您可以通过几种不同的方法将文件从一个虚拟机复制到另一个虚拟机。这里，我们假设您想要从 IP 地址为 192.168.4.5 的虚拟机上的 /tmp 文件夹复制文件到当前虚拟机（192.168.4.6）的 /tmp 文件夹下。以下是几种…...

编程日记 2024/11/29 7:58:44

如何为 XFS 文件系统的 /dev/centos/root 增加 800G 空间

如何为 XFS 文件系统的 /dev/centos/root 增加 800G 空间一、前言二、准备工作三、扩展逻辑卷1. 检查现有 LVM 配置2. 扩展物理卷3. 扩展卷组4. 扩展逻辑卷四、调整文件系统大小1. 检查文件系统状态2. 扩展文件系统五、处理可能出现的问题1. 文件系统无法扩展2. 磁盘空间不足3…...

编程日记 2024/11/29 7:56:42

Java算法OJ（11）双指针练习

目录 1.前言 2.正文 2.1存在重复数字 2.1.1题目 2.1.2解法一代码解析： 2.1.3解法二代码解析： 2.2存在重复数字plus 2.2.1题目 2.2.2代码 2.2.3解析 3.小结 1.前言哈喽大家好吖，今天来给大家分享双指针算法的相关练习&…...

编程日记 2024/11/29 7:55:41

44.扫雷第二部分、放置随机的雷，扫雷，炸死或成功 C语言

按照教程打完了。好几个bug都是自己打出来的。比如统计周围8个格子时，有一个各自加号填成了减号。我还以为平移了，一会显示是0一会显示是2。结果单纯的打错了。debug的时候断点放在scanf后面会顺畅一些。中间多放一些变量名方便监视。以及mine要多显示&a…...

编程日记 2024/11/29 7:51:38

大语言模型LLM的微调代码详解

代码的摘要说明一、整体功能概述这段 Python 代码主要实现了基于 Hugging Face Transformers 库对预训练语言模型（具体为 TAIDE-LX-7B-Chat 模型）进行微调（Fine-tuning）的功能，使其能更好地应用于生成唐诗相关内容的…...

编程日记 2024/11/29 7:50:37

钉钉与企业微信机器人：助力网站定时任务高效实现

钉钉、企业微信机器人在网站定时任务中的应用，主要体现在自动化通知、提醒以及数据处理等方面。以下是一些具体的应用场景： 1. 自动化通知项目进度提醒：在蒙特网站所负责的软件开发或网站建设项目中，可以利用机器人设置定时任…...

编程日记 2024/11/29 7:49:32

自然语言处理工具-广告配音工具用于语音合成助手/自媒体配音/广告配音/文本朗读-已经解锁了全功能的 apk包

Android -「安卓端」广告配音工具用于语音合成助手/自媒体配音/广告配音/文本朗读。广告配音工具：让您的文字“说话”，在这个快速发展的数字时代，广告配音工具为各种语音合成需求提供了一站式解决方案。无论是自媒体配音、商业广告配音、…...

编程日记 2024/11/29 7:48:26

深入解析注意力机制

引言随着深度学习的快速发展，注意力机制（Attention Mechanism）逐渐成为许多领域的关键技术，尤其是在自然语言处理（NLP）和计算机视觉（CV）中。其核心思想是赋予模型“关注重点”的能力…...

编程日记 2024/11/29 7:47:24

Unity图形学之雾Fog

1.设置雾化： 2.雾化变化曲线：FogMode （1）线性： （2）一次指数： （3）二次指数： Shader "Custom/FogTest" {Properties{_Color ("Color…...

编程日记 2024/11/29 7:46:23

使用Taotoken后模型API调用的延迟与稳定性观测体验分享

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度使用Taotoken后模型API调用的延迟与稳定性观测体验分享作为一名日常需要与多种大模型API打交道的开发者，模型服务的稳…...

编程新知 2026/5/13 1:43:40

20 鸿蒙LiteOS信号量原理实战：信号量作用、MAX_COUNT含义、线程同步源码解析

鸿蒙LiteOS信号量原理实战：信号量作用、MAX_COUNT含义、线程同步源码解析一、前言本文基于小凌派 RK2206鸿蒙LiteOS标准示例代码，从零讲解LiteOS内核信号量核心概念：为什么需要信号量、信号量能干什么、MAX_COUNT参数真实含义&#xff0c…...

编程新知 2026/5/12 21:54:21

通用大模型vs行业垂直AI Agent，制造业落地对比：2026年企业级智能体选型深度解析

进入2026年，人工智能在制造业的落地已从早期的“对话式交互”全面转向“任务式闭环”。通用大模型（Foundation Models）与行业垂直AI Agent（Vertical AI Agents）在工业场景中的角色分工日益明确。根据IDC最新发布的《20…...

编程新知 2026/5/12 20:57:31

终极网盘直链下载助手完整指南：告别限速，快速获取八大平台真实下载地址

终极网盘直链下载助手完整指南：告别限速，快速获取八大平台真实下载地址【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里…...

编程新知 2026/5/12 20:44:18

管式土壤墒情监测站：深埋地下测湿度，云端上报助灌溉

管式土壤墒情监测站采用土壤介电常数检测原理，结合专业数学模型算法，搭配独创螺旋式测量电极结构开展高精度土壤含水率监测。土壤介电常数与土壤含水量存在稳定且精准的对应关系，设备通过传感器高频感知土层介电参数变化，经内置算…...

编程新知 2026/5/12 17:54:20

MySQL 数据库基础入门：从概念到实战

前言：在程序开发中，数据存储是核心需求之一。虽然文件也能保存数据，但面对安全性、查询效率、海量存储等场景，文件存储的短板暴露无遗。而数据库作为专门的数据分析和管理工具，完美解决了这些问题，成为程序…...

编程新知 2026/5/12 16:15:32

如何在手机上免费播放任何视频格式？VLC for Android给你答案！

如何在手机上免费播放任何视频格式？VLC for Android给你答案！ 【免费下载链接】vlc-android VLC for Android, Android TV and ChromeOS 项目地址: https://gitcode.com/gh_mirrors/vl/vlc-android 你是否曾经遇到过这样的情况：下载了…...

编程新知 2026/5/12 16:13:18

TEdit地图编辑器：从新手到专家的泰拉瑞亚世界创作指南【免费下载链接】Terraria-Map-Editor TEdit - Terraria Map Editor - TEdit is a stand alone, open source map editor for Terraria. It lets you edit maps just like (almost) paint! It also lets you ch…...

编程新知 2026/5/12 15:50:12