当前位置：首页 > news >正文

C++哈希（链地址法）（二）详解

news 2026/2/11 3:26:01

文章目录

1.开放地址法
- 1.1key不能取模的问题
- - 1.1.1将字符串转为整型
  - 1.1.2将日期类转为整型
2.哈希函数
- 2.1乘法散列法（了解）
- 2.2全域散列法（了解）
3.处理哈希冲突
- 3.1线性探测（挨着找）
- 3.2二次探测（跳跃着找）
- 3.3双重散列（了解）
4.链地址法
- 4.1扩容
- 4.2基本的框架
- 4.3插入
- 4.4查找
- 4.5删除
5.代码

1.开放地址法

1.1key不能取模的问题

当key是string/Date等类型时，key不能取模，那么我们需要给HashTable增加一个仿函数，这个仿函数支持把key转换成一个可以取模的整形，如果key可以转换为整形并且不容易冲突，那么这个仿函数就用默认参数即可，如果这个Key不能转换为整形，我们就需要自己实现一个仿函数传给这个参数，实现这个仿函数的要求就是尽量key的每个值都参与到计算中，让不同的key转换出的整形值不同。string做哈希表的key非常常见，所以我们可以考虑把string特化一下。

1.1.1将字符串转为整型

key如果是字符串，转为整形需要仿函数

// key / M , M哈希表的空间大小
size_t hash0 = hash(kv.first) % _tables.size();// 将key转为无符号的整形，因为key可能是负数
template<class K>
struct HashFunc
{size_t operator()(const K& key){return (size_t)key;}
};// 特化
template<>
struct HashFunc<string>
{size_t operator()(const string& s){size_t sum = 0;for (auto& ch : s){sum += ch;sum *= 131;// *131为了避免哈希冲突,每次的key都不一样}return sum;}
};int main()
{const char* a[] = { "abcd","def","gca" };HashTable<string, string> ha;// 类型+()是匿名对象// 哈希冲突了cout << HashFunc<string>()("abcd") << endl;cout << HashFunc<string>()("aadd") << endl;cout << HashFunc<string>()("acbd") << endl;for (auto& ch : a){ha.Insert({ ch,ch });}return 0;
}

1.1.2将日期类转为整型

struct Date
{int _year;int _month;int _day;Date(int year = 1,int month = 1,int day = 1):_year(year),_month(month),_day(day){}bool operator==(const Date& d){return _year == d._year&&_month == d._month&&_day == d._day;}
};struct DateHashFunc
{size_t operator()(const Date& d){size_t hash = 0;hash += d._year;hash *= 131;hash += d._month;hash *= 131;hash += d._day;hash *= 131;return hash;}
};int main()
{// 将日期类转化为整型HashTable<Date, int, DateHashFunc> ht;ht.Insert({ { 2024,12,10 }, 1 });ht.Insert({ { 2024,10,12 }, 1 });return 0;
}

2.哈希函数

设计哈希函数为了减少冲突，让更多的位参与运算，不管使用%不太接近2的幂次方的质数，还是用位运算计算都是可以的

2.1乘法散列法（了解）

乘法散列法对哈希表大小M没有要求，他的大思路第一步：用关键字 Key 乘上常数 A (0<A<1)，并抽
取出 key * A 的小数部分。第二步：后再用M乘以key*A 的小数部分，再向下取整。
h(key) = floor(M × ((A × key)%1.0)) ，其中floor表示对表达式进行下取整，A∈(0,1)，这里最重要的是A的值应该如何设定，Knuth认为 A = ( 5 − 1)/2 = 0.6180339887… (黄金分割点])比较好。
乘法散列法对哈希表大小M是没有要求的，假设M为1024，key为1234，A = 0.6180339887, A * key
= 762.6539420558，取小数部分为0.6539420558, M×((A×key)%1.0) = 0.6539420558*1024 =669.6366651392，那么h(1234) = 669。

2.2全域散列法（了解）

如果存在一个恶意的对手，他针对我们提供的散列函数，特意构造出一个发生严重冲突的数据集，比如，让所有关键字全部落入同一个位置中。这种情况是可以存在的，只要散列函数是公开且确定的，就可以实现此攻击。解决方法自然是见招拆招，给散列函数增加随机性，攻击者就无法找出确定可以导致最坏情况的数据。这种方法叫做全域散列。
hab (key) = ((a × key + b)%P)%M ，P需要选⼀个足够大的质数，a可以随机选[1,P-1]之间的任意整数，b可以随机选[0,P-1]之间的任意整数，这些函数构成了一个P*(P-1)组全域散列函数组。假设P=17，M=6，a = 3， b = 4, 则 h34 (8) = ((3 × 8 + 4)%17)%6 = 5 。
需要注意的是每次初始化哈希表时，随机选取全域散列函数组中的⼀个散列函数使用，后续增删查改都固定使用这个散列函数，否则每次哈希都是随机选一个散列函数，那么插入是一个散列函数，查找又是另一个散列函数，就会导致找不到插入的key了。

在这里插入图片描述

3.处理哈希冲突

3.1线性探测（挨着找）

缺点：堆积

3.2二次探测（跳跃着找）

缺点：无法充分利用位置
3.1和3.2上一篇博客详细说明了

3.3双重散列（了解）

缺点：虽然可以充分利用位置，但是还是要解决冲突的问题

h1 (key) = hash0 = key % M , hash0位置冲突了，则双重探测公式为：hc(key, i) = hashi =
(hash0 + i ∗ h2 (key)) % M， i = {1, 2, 3, …, M}
要求 h2 (key) < M 且 h2 (key) 和M互为质数，有两种简单的取值方法：
1、当M为2整数幂时，h2 (key) 从[0，M-1]任选一个奇数；
2、当M为质数时， h2 (key) = key % (M − 1) + 1
反例：保证 h2 (key) 与M互质是因为根据固定的偏移量所寻址的所有位置将形成一个群，若最大公约数说无法充分利用整个散列表。举例来说，若初始探查位置为1，偏移量为3，整个散列表大小为12，那么所能寻址的位置为{1, 4, 7, 10}，寻址个数为p = gcd(M, h1 (key)) > 1 ，那么所能寻址的位置的个数为 M/P < M ，使得对于一个关键字来
12/gcd(12, 3) = 4
下面演示 {19,30,52,74} 等这一组值映射到M=11的表中，设 h2 (key) = key%10 + 1
本质是跳跃探测，减少冲突堆积
双重散列就是让数据更加地分散，不容易产生哈希冲突

在这里插入图片描述

4.链地址法

开放地址法的问题是你占别人位置，别人来了又占其他人的位置，链地址法就不用占别人的位置，自己位置可以存多个位置，用了链表挂了多个数据

4.1扩容

开放地址法的负载因子必须小于1，链地址法的负载因子没有这种规定，可以大于1，但是unordered_xxx中最大负载因子基本控制在1，大于1就会扩容。

4.2基本的框架

namespace hash_bucket
{template<class K,class V>struct HashNode{pair<K, V> _kv;HashNode<K, V>* _next;HashNode(const pair<K,V>& kv):_kv(kv),_next(nullptr){}};template<class K,class V,class Hash = HashFunc<K>>class HashTable{typedef HashTable<K, V> Node;public:// 构造HashTable():_tables(__stl_next_prime(0)),_n(0){}private:vector<Node*> _tables;// 指针数组size_t _n;// 表示存了多少个数据};
}

4.3插入

头插，尾插都可以，这里用了头插
在这里插入图片描述

// 插入
bool Insert(const pair<K,V>& kv)
{// 负载因子 == 1时扩容if (_n == _tables.size()){// 这种方法每个节点都要拷贝,影响效率// 并且原数组释放完后,不会自动析构每个节点,因为是内置类型// 还要自己写析构函数,比较麻烦//HashTable<K, V> newht;//newht._tables.resize(_stl_next_prime(tables.size() + 1));////for(size_t i = 0;i < _tables.size();i++)//{//	// 旧表的数据扩容后可能不冲突,必须一个一个取//	Node* cur = _tables[i];//	while (cur)//	{//		newht.Insert(cur->_kv);//		cur = cur->_next;//	}//}//_tables.swap(newht._tables);vector<Node*> newTable(_tables.size() * 2);for(size_t i = 0;i < _tables.size();i++){// 表旧表中的数据插入到新表中Node* cur = _tables[i];while (cur){Node* next = cur->_next;// 算cur在新表中的位置size_t hashi = cur->_kv.first % newTable.size();cur->_next = newTable[hashi];newTable[hashi] = cur;cur = next;}_tables[i] = nullptr;}_tables.swap(newTable);}size_t hashi = kv.first % _tables.size();// 头插Node* newnode = new Node(kv);newnode->_next = _tables[hashi];_tables[hashi] = newnode;++_n;return true;
}int main()
{int a2[] = { 19,30,5,36,13,20,21,12,24,96 };hash_bucket::HashTable<int, int> ht;for (auto e : a2){ht.Insert({ e,e });}ht.Insert({ 100,100 });ht.Insert({ 200,200 });return 0;
}

4.4查找

// 查找
Node* Find(const K& key)
{size_t hashi = key % _tables.size();Node* cur = _tables[hashi];while (cur){if (cur->_kv.first == key){return cur;}cur = cur->_next;}return nullptr;
}

4.5删除

删除分为三种情况：

头删，让下一个节点变为头节点
删除中间的节点，保留前一个节点的指针指向后一个节点的指针
尾删，让最后一个节点的前一个节点的指针指向空
2和3可以归为一类，删除中间的节点可以是前一个节点指向空

// 删除
bool Erase(const K& key)
{size_t hashi = key % _tables.size();Node* cur = _tables[hashi];Node* prev = nullptr;while (cur){if (cur->_kv.first == key){if (prev == nullptr){// 头删_tables[hashi] = cur->_next;}else{// 删除中间的节点prev->_next = cur->_next;}delete cur;--_n;return true;}else{prev = cur;cur = cur->_next;}}return false;
}

5.代码

namespace hash_bucket
{template<class K,class V>struct HashNode{pair<K, V> _kv;HashNode<K, V>* _next;HashNode(const pair<K,V>& kv):_kv(kv),_next(nullptr){}};template<class K,class V,class Hash = HashFunc<K>>class HashTable{typedef HashNode<K, V> Node;public:// 构造HashTable():_tables(__stl_next_prime(0)),_n(0){}// 析构~HashTable(){for (size_t i = 0; i < _tables.size(); i++){Node* cur = _tables[i];while (cur){Node* next = cur->_next;delete cur;cur = next;}_tables[i] = nullptr;}}// 插入bool Insert(const pair<K,V>& kv){Hash hash;// 如果插入的值存在冗余了返回falseif (Find(kv.first)){return false;}// 负载因子 == 1时扩容if (_n == _tables.size()){// 这种方法每个节点都要拷贝,影响效率// 并且原数组释放完后,不会自动析构每个节点,因为是内置类型// 还要自己写析构函数,比较麻烦//HashTable<K, V> newht;//newht._tables.resize(_stl_next_prime(tables.size() + 1));////for(size_t i = 0;i < _tables.size();i++)//{//	// 旧表的数据扩容后可能不冲突,必须一个一个取//	Node* cur = _tables[i];//	while (cur)//	{//		newht.Insert(cur->_kv);//		cur = cur->_next;//	}//}//_tables.swap(newht._tables);vector<Node*> newTable(__stl_next_prime(_tables.size() + 1));for(size_t i = 0;i < _tables.size();i++){// 表旧表中的数据插入到新表中Node* cur = _tables[i];while (cur){Node* next = cur->_next;// 算cur在新表中的位置size_t hashi = hash(cur->_kv.first) % newTable.size();cur->_next = newTable[hashi];newTable[hashi] = cur;cur = next;}_tables[i] = nullptr;}_tables.swap(newTable);}size_t hashi = hash(kv.first) % _tables.size();// 头插Node* newnode = new Node(kv);newnode->_next = _tables[hashi];_tables[hashi] = newnode;++_n;return true;}// 查找Node* Find(const K& key){Hash hash;size_t hashi = hash(key) % _tables.size();Node* cur = _tables[hashi];while (cur){if (cur->_kv.first == key){return cur;}cur = cur->_next;}return nullptr;}// 删除bool Erase(const K& key){size_t hashi = key % _tables.size();Node* cur = _tables[hashi];Node* prev = nullptr;while (cur){if (cur->_kv.first == key){if (prev == nullptr){// 头删_tables[hashi] = cur->_next;}else{// 删除中间的节点prev->_next = cur->_next;}delete cur;--_n;return true;}else{prev = cur;cur = cur->_next;}}return false;}private:vector<Node*> _tables;// 指针数组size_t _n;// 表示存了多少个数据};
}

C++哈希（链地址法）（二）详解

文章目录 1.开放地址法1.1key不能取模的问题1.1.1将字符串转为整型1.1.2将日期类转为整型 2.哈希函数2.1乘法散列法（了解）2.2全域散列法（了解） 3.处理哈希冲突3.1线性探测（挨着找）3.2二次探测（跳…...

编程日记 2025/2/3 1:03:34

IME关于输入法横屏全屏显示问题-Android14

IME关于输入法横屏全屏显示问题-Android14 1、输入法全屏模式updateFullscreenMode1.1 全屏模式判断1.2 全屏模式布局设置 2、应用侧关闭输入法全屏模式2.1 调用输入法的应用设置flag2.2 继承InputMethodService.java的输入法应用覆盖onEvaluateFullscreenMode方法 InputMethod…...

编程日记 2025/2/3 1:00:30

网络工程师（11）软件生命周期与开发模型

一、软件生命周期前言软件生命周期，也称为软件开发周期或软件开发生命周期，是指从软件项目的启动到软件不再被使用为止的整个期间。这个过程可以细分为多个阶段，每个阶段都有其特定的目标、任务和产出物。 1. 问题定义与需求分析问题定义…...

编程日记 2025/2/3 0:59:27

【人工智能】基于Python的机器翻译系统，从RNN到Transformer的演进与实现

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界机器翻译（Machine Translation, MT）作为自然语言处理领域的重要应用之一，近年来受到了广泛的关注。在本篇文章中，我们将详细探讨如何使…...

编程日记 2025/2/3 0:52:10

网络工程师（12）软件开发与测试

一、软件设计 （一）定义与目的软件设计是从软件需求出发，设计软件的整体结构、功能模块、实现算法及编写代码的过程，旨在确定系统如何完成预定任务。其目标是确保目标系统能够抽象、普遍地完成预定任务，并为后续的软件…...

编程日记 2025/2/3 0:50:50

3.Spring-事务

一、隔离级别： 脏读： 一个事务访问到另外一个事务未提交的数据。不可重复读： 事务内多次查询相同条件返回的结果不同。幻读： 一个事务在前后两次查询同一个范围的时候，后一次查询看到了前一次查询没有看到的行。二…...

编程日记 2025/2/3 0:49:49

Python字典详解：从入门到实践

Python字典详解：从入门到实践字典（Dictionary）是Python中最重要且最常用的数据结构之一。本文将深入讲解字典的特性、操作方法和实际应用案例。 1. 字典简介字典是可变的、无序的键值对集合，使用{}创建。每个元素由key: valu…...

编程日记 2025/2/3 0:47:46

91，【7】攻防世界 web fileclude

进入靶场 <?php // 包含 flag.php 文件 include("flag.php");// 以高亮语法显示当前文件（即包含这段代码的 PHP 文件）的内容 // 方便查看当前代码结构和逻辑，常用于调试或给解题者提示代码信息 highlight_file(__FILE__);// 检…...

编程日记 2025/2/3 0:46:43

41【文件名的编码规则】

我们在学习的过程中，写出数据或读取数据时需要考虑编码类型火山采用：UTF-16 易语言采用：GBK php采用：UTF-8 那么我们写出的文件名应该是何种编码的？比如火山程序向本地写出一个“测试.txt”，理论上这个“测…...

编程日记 2025/2/3 0:44:40

蓝桥杯备赛经验帖

蓝桥杯备赛经验帖作者：blue 时间：2025.2.1 文章目录蓝桥杯备赛经验帖1.为什么有这篇文章2.赛制3.比赛流程4.如何准备5.其他建议6.一些感悟 1.为什么有这篇文章笔者近期发现，观看我写的两道第十五届蓝桥杯题解的人数逐渐增多&#xf…...

编程日记 2025/2/3 0:43:38

一文大白话讲清楚webpack基本使用——17——Tree Shaking

文章目录一文大白话讲清楚webpack基本使用——17——Tree Shaking1. 建议按文章顺序从头看，一看到底，豁然开朗2. 啥叫Tree Shaking3. 什么是死代码，怎么来的3. Tree Shaking的流程3.1 标记3.2 利用Terser摇起来 4. 具体使用方式4.1 适用前提…...

编程日记 2025/2/3 0:39:34

【C++ 区间位运算】3209. 子数组按位与值为 K 的数目|2050

本文涉及知识点位运算、状态压缩、枚举子集汇总 LeetCode3209. 子数组按位与值为 K 的数目给你一个整数数组 nums 和一个整数 k ，请你返回 nums 中有多少个子数组满足：子数组中所有元素按位 AND 的结果为 k 。示例 1： 输入&#xff1a…...

编程日记 2025/2/3 0:37:30

scale.rs代码是几何变换库euclid中典型的数据结构和方法的例子，用于处理二维和三维空间中的缩放变换。一、scale.rs文件源码 //! A type-checked scaling factor between units.use crate::num::One;use crate::approxord::{max, min}; use crate::{Box2D, Box3D…...

编程日记 2025/2/3 0:36:25

二分机器人的跳跃问题

二段性:找到一个值，大于此值的时候都成立，小于的时候都不成立更新的方式只有两种，左边的mid更新不需要1；右边的mid更新需要1 //对能量进行二分，确定能量的范围 //特判防止溢出int #include<bits/stdc.h> using…...

编程日记 2025/2/3 0:35:21

Hive:复杂数据类型之Map函数

Map函数是Hive里面的一种复杂数据类型, 用于存储键值对集合。Map中的键和值可以是基础类型或复合类型，这使得Map在处理需要关联存储信息的数据时非常有用。定义map时,需声明2个属性: key 和 value , map中是 key value 组成一个元素 key-value, key必须为原始类…...

编程日记 2025/2/3 0:28:11

R 字符串：深入理解与高效应用

R 字符串：深入理解与高效应用引言在R语言中，字符串是数据处理和编程中不可或缺的一部分。无论是数据清洗、数据转换还是数据分析，字符串的处理都是基础技能。本文将深入探讨R语言中的字符串概念，包括其基本操作、常见函数以及高效应用方法。字符串基本概念字符串定…...

编程日记 2025/2/3 0:18:01

设计模式Python版桥接模式

文章目录前言一、桥接模式二、桥接模式示例三、桥接模式与适配器模式的联用前言 GOF设计模式分三大类： 创建型模式：关注对象的创建过程，包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式&…...

编程日记 2025/2/3 0:14:55

记5（一元逻辑回归+线性分类器+多元逻辑回归

目录 1、一元逻辑回归2、线性可分&线性不可分3、Iris数据集实现多元逻辑回归4、绘制分类图5、鸢尾花分类图6、多分类问题：（softmax回归）6.1、编码：自然顺序码、独热编码、独冷编码6.2、二/多分类问题：6.3、softmax…...

编程日记 2025/2/3 0:10:47

【Python】第七弹---Python基础进阶：深入字典操作与文件处理技巧

✨个人主页： 熬夜学编程的小林 💗系列专栏： 【C语言详解】【数据结构详解】【C详解】【Linux系统编程】【MySQL】【Python】目录 1、字典 1.1、字典是什么 1.2、创建字典 1.3、查找 key 1.4、新增/修改元素 1.5、删除元素 1.6、遍历…...

编程日记 2025/2/3 0:08:45

Nginx 运维开发高频面试题详解

一、基础核心问题原文链接：https://blog.csdn.net/weixin_51146329/article/details/142963853 1、什么是Nginx？ Nginx 是一个高性能的 HTTP 和反向代理服务器，它以轻量级和高并发处理能力而闻名。Nginx 的反向代理功能允许它作为前端服务…...

编程日记 2025/2/3 0:07:37

智慧工地云平台源码，基于微服务架构+Java+Spring Cloud +UniApp +MySql

智慧工地管理云平台系统，智慧工地全套源码，java版智慧工地源码，支持PC端、大屏端、移动端。智慧工地聚焦建筑行业的市场需求，提供“平台网络终端”的整体解决方案，提供劳务管理、视频管理、智能监测、绿色施工、安全管…...

编程新知 2026/1/30 15:16:32

MongoDB学习和应用(高效的非关系型数据库)

一丶 MongoDB简介对于社交类软件的功能，我们需要对它的功能特点进行分析： 数据量会随着用户数增大而增大读多写少价值较低非好友看不到其动态信息地理位置的查询… 针对以上特点进行分析各大存储工具： mysql：关系型数据库&am…...

编程新知 2026/1/23 10:24:30

基于Flask实现的医疗保险欺诈识别监测模型

基于Flask实现的医疗保险欺诈识别监测模型项目截图项目简介社会医疗保险是国家通过立法形式强制实施，由雇主和个人按一定比例缴纳保险费，建立社会医疗保险基金，支付雇员医疗费用的一种医疗保险制度， 它是促进社会文明和进步的…...

编程新知 2026/1/24 14:59:08

【大模型RAG】Docker 一键部署 Milvus 完整攻略

本文概要 Milvus 2.5 Stand-alone 版可通过 Docker 在几分钟内完成安装；只需暴露 19530（gRPC）与 9091（HTTP/WebUI）两个端口，即可让本地电脑通过 PyMilvus 或浏览器访问远程 Linux 服务器上的 Milvus。下面…...

编程新知 2026/1/31 8:08:07

2.Vue编写一个app

1.src中重要的组成 1.1main.ts // 引入createApp用于创建应用 import { createApp } from "vue"; // 引用App根组件 import App from ./App.vue;createApp(App).mount(#app)1.2 App.vue 其中要写三种标签 <template>  </template>…...

编程新知 2026/1/31 6:04:01

【Zephyr 系列 10】实战项目：打造一个蓝牙传感器终端 + 网关系统（完整架构与全栈实现）

🧠关键词：Zephyr、BLE、终端、网关、广播、连接、传感器、数据采集、低功耗、系统集成 📌目标读者：希望基于 Zephyr 构建 BLE 系统架构、实现终端与网关协作、具备产品交付能力的开发者 📊篇幅字数：约 5200 字 ✨ 项目总览在物联网实际项目中，**“终端 + 网关”**是…...

编程新知 2026/1/31 6:12:22

3403. 从盒子中找出字典序最大的字符串 I

3403. 从盒子中找出字典序最大的字符串 I 题目链接：3403. 从盒子中找出字典序最大的字符串 I 代码如下： class Solution { public:string answerString(string word, int numFriends) {if (numFriends 1) {return word;}string res;for (int i 0;i &…...

编程新知 2025/10/31 5:18:02

ios苹果系统，js 滑动屏幕、锚定无效

现象：window.addEventListener监听touch无效，划不动屏幕，但是代码逻辑都有执行到。 scrollIntoView也无效。原因：这是因为 iOS 的触摸事件处理机制和 touch-action: none 的设置有关。ios有太多得交互动作，从而会影响…...

编程新知 2026/2/4 19:47:03

有限自动机到正规文法转换器v1.0

1 项目简介这是一个功能强大的有限自动机（Finite Automaton, FA）到正规文法（Regular Grammar）转换器，它配备了一个直观且完整的图形用户界面，使用户能够轻松地进行操作和观察。该程序基于编译原理中的经典…...

编程新知 2026/1/31 13:13:32

深入浅出深度学习基础：从感知机到全连接神经网络的核心原理与应用

文章目录前言一、感知机 (Perceptron)1.1 基础介绍1.1.1 感知机是什么？1.1.2 感知机的工作原理 1.2 感知机的简单应用：基本逻辑门1.2.1 逻辑与 (Logic AND)1.2.2 逻辑或 (Logic OR)1.2.3 逻辑与非 (Logic NAND) 1.3 感知机的实现1.3.1 简单实现 (基于阈…...

编程新知 2026/1/26 13:29:00