哈希表和STL —— unorderde_set/unordered_map【复习笔记】
1. 哈希表的相关概念
1.1 哈希表的定义
哈希表,又称为散列表,是根据关键字直接进行访问的数据结构。
它通过一个哈希函数(Hash Function),建立了一种关键字和存储地址间的直接映射关系,将每个关键字映射到一个固定大小的数组中的一个位置,这个位置被称为哈希地址或索引。理想情况下,散列表的查找的时间复杂度为O(1),和表中元素数量无关
1.2 哈希冲突
1.2.1 哈希冲突的定义
哈希表可能把两个或两个以上的不同关键字映射到同一个地址,这种情况就叫哈希冲突,也加散列冲突,起冲突的不同关键字,称为同义词
1.2.2 处理哈希冲突的方法
1. 线性探测法
从冲突位置开始,依次线性向后探测,直到找到下一个没有存储数据的位置(如果走到哈希表尾,则返回哈希表头)
2. 链地址法
所有元素不直接存储到哈希表中,哈希表存储指针,每数据时指针为空,当有多个关键字映射到同一个位置,将这些数据串成链表,挂在该位置下面
1.3 哈希函数
1.3.1 哈希函数的定义
将关键字映射成对应地址的函数就是哈希函数,也叫散列函数,记为 Hash(key)= Addr
1.3.2 常见的哈希函数
1. 直接定址法
直接取关键字的某个线性函数值作为散列地址,散列函数是 Hash(key)= a * key + b(a和b为常数)
2. 除留余数法
假设哈希表的大小为 M ,通过 key 除以 M 的余数作为映射位置的下标,散列函数是 Hash(key)= key % M
注意:
1. M 取不太接近 2 的整数次幂的一个质数。( 一般来讲,将关键字范围扩大 2 倍,取大于这个范围的质数即可)
2. key 有可能为负数,取模之后也会有负数。负数补正加上模数即可,但这样的活正数和负数的操作就不同一,为了方便,同一为 模加模:
无论key是正数还是负数:( key % N + N )% N
3. 其他方法
数学分析法、平方取中法、折叠法、随机数法......这些方法相对局限
2. 哈希表的具体实现
案例:维护一个数据结构,初始为空,有以下操作:
1 x:插入元素 x
2 x:查询元素是否在数据结构中
输入描述:第一行一个整数 n ,表示操作次数 (假设插入操作次数小于10次)
之后 n 行,第 i 行两个整数 op、x,表示第 op 个操作和元素 x
2.1 除留取余法(哈希函数) + 线性探测法(处理哈希冲突)
#include<iostream>
#include<cstring>
using namespace std;
//根据题目的插入操作次数的范围,找到一个合适的模数创建哈希表
//范围扩大两倍,N 是质数
const int N = 23;
int h[N];//将哈希表的所有元素初始化为一个不会取到的值
//如果初始化为0或其他数,那可能无法辨别该数是初始数还是放入的数
//一般这个取不到的值为0x3f3f3f3f
const int INF = 0x3f3f3f3f;
void Init()
{memset(h, 0x3f, sizeof(h));
}//哈希函数返回映射位置
int h_f(int x)
{//模加模int id = (x % N + N) % N;//线性探测法处理哈希冲突while (h[id] != INF && h[id] != x){id++;if (id == N) id = 0;}return id;
}//插入元素
void insert(int x)
{int id = h_f(x);h[id] = x;
}//查找元素
bool find(int x)
{int id = h_f(x);return h[id] == x;
}
int main()
{Init();int n; cin >> n;while (n--){int op, x; cin >> op >> x;if (op == 1){insert(x);}else{if (find(x))cout << "yes" << endl;else cout << "no" << endl;}}return 0;
}
2.2 除留取余法(哈希函数) + 链地址法(处理哈希冲突)
该实现方法和(用数组实现树的遍历存储)中的链式前向星方法一样,本质是数组模拟链表
#include<iostream>
using namespace std;
#include<cstring>
//根据题目的插入操作次数的范围,找到一个合适的模数创建哈希表
//范围扩大两倍,N 是质数
const int N = 23;
int h[N];//数组模拟链表
int e[N], ne[N],id;//除留取余法
int f(int x)
{return (x % N + N) % N;
}//查找元素
bool find(int x)
{//得到 x 对应的哈希值int idx = f(x);//遍历链表for (int i = h[idx]; i; i = ne[i]){if (e[i] == x) return true;}return false;
}//插入元素
void insert(int x)
{//先判断该元素是否存在if (find(x)) return;int idx = f(x);//头插id++;e[id] = x;ne[id] = h[idx];h[idx] = id;
}int main()
{int n; cin >> n;while (n--){int op, x; cin >> op >> x;if (op == 1){insert(x);}else{if (find(x)) cout << "yes" << endl;else cout << "no" << endl;}}return 0;
}
3. unordered_set/unordered_multiset
unordered_set 和 set(红黑树和STL——set/map)的区别是,前者使用哈希表实现,而后者使用红黑树实现。导致的结果就是存储和查找的速率不一样,以及前者无序,后者有序,其他的使用方式完全一样。
而unordered_set 和 unordered_multiset 的区别:unordered_set 不能存相同的元素而unordered_multiset 可以存相同元素
#include<iostream>
#include<unordered_set>
using namespace std;int main()
{int arr[] = { 3,5,6,8,9,2,10,1 };unordered_set<int> mp;//begin/end:迭代器,可以用范围for遍历哈希表//和红黑树实现的 set 不同,遍历出来的结果是无序的for (auto& e : arr){//insert:插入,时间复杂度近似为O(1)mp.insert(e);}//find:查找一个元素,返回迭代器//count:查询一个元素出现的次数,一般用来判断该元素是否在哈希表中//时间复杂度都近似为O(1)if (mp.count(3)) cout << "yes" << endl;else cout << "no" << endl;//erase:删除元素,时间复杂度近似为O(1)mp.erase(3);if (mp.count(3)) cout << "yes" << endl;else cout << "no" << endl;//size:返回哈希表中元素个数,时间复杂度O(1)cout << mp.size() << endl;//empty:判断哈希表是否为空,时间复杂度O(1)if (mp.empty()) cout << "空" << endl;else cout << "非空" << endl;return 0;
}
4. unordered_map/unordered_multimap
unordered_map 和 map(红黑树和STL——set和map)的区别是,前者使用哈希表实现,而后者使用红黑树实现。导致的结果就是存储和查找的速率不一样,以及前者无序,后者有序,其他的使用方式完全一样。
而unordered_map 和 unordered_multimap 的区别:unordered_map 不能存相同的元素而unordered_multimap 可以存相同元素
还有一点,无论是 map 还是 unordered_map 都可以存图,但 map 的查找速率较低,而 unordered_map 的查找速率较高
#include<iostream>
#include<unordered_map>
#include<vector>
using namespace std;void test()
{unordered_map<int, vector<int>> mp;mp[1].push_back(2);mp[2] = { 3, 4, 5 };mp[3].push_back(1);mp[3].push_back(2);for (auto& p : mp){cout << p.first << ":";for (auto& b : mp[p.first]) cout << b << " ";cout << endl;}
}int main()
{unordered_map<string, int> mp;//insert:插入元素,时间复杂度近似O(1)//用{}将元素括起来mp.insert({ "lili",1 });mp.insert({ "kiki",2 });mp.insert({ "vivi",3 });//c++17的结构化绑定for (auto& [k,v] : mp){cout << k << "编号:" << v << endl;}//operator[]:重载[],让unordered_map可以像数组一样使用//但operator[]可能会向 map 插入意料外的元素//插入时,第一个关键字为[]里内容,第二个关键字为默认值//会把<"hihi",0>放入if (mp["hihi"] == 4) cout << "hihi=4" << endl;else cout << "no" << endl;//begin/end:迭代器,用范围for遍历for (auto& [k, v] : mp){cout << k << "编号:" << v << endl;}//erase:删除,时间复杂度近似O(1)mp.erase("hihi");//find:查找元素,返回迭代器//count:查询元素出现次数,一般用来判断元素是否在哈希表中//时间复杂度都近似O(1)if(mp.count("lili")) cout << "yes" << endl;else cout << "no" << endl;//size:求哈希表元素个数//empty:判断哈希表是否为空//时间复杂度都近似O(1)cout << mp.size() << endl;if (mp.empty()) cout << "空" << endl;else cout << "非空" << endl;//存图test();
}相关文章:
哈希表和STL —— unorderde_set/unordered_map【复习笔记】
1. 哈希表的相关概念 1.1 哈希表的定义 哈希表,又称为散列表,是根据关键字直接进行访问的数据结构。 它通过一个哈希函数(Hash Function),建立了一种关键字和存储地址间的直接映射关系,将每个关键字映射…...
计算机毕业设计SpringBoot+Vue.js体育馆使用预约平台(源码+文档+PPT+讲解)
温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 温馨提示:文末有 CSDN 平台官方提供的学长联系方式的名片! 作者简介:Java领…...
42 session反序列化漏洞
参考资料:3. php反序列化从入门到放弃(入门篇) - bmjoker - 博客园 session文件上传漏洞利用原理 当在php.ini中设置session.upload_progress.enabled On的时候,PHP将能够跟踪上传单个文件的上传进度。当上传正在进行时,以及在将与session…...
【Jenkins】个人向-Jenkinsfile如何写
官方参考:https://www.jenkins.io/doc/book/pipeline/syntax/ Pipeline Utility Steps 插件:https://birdbook.com.cn/ops/ci/jenkins/plugins/pipeline%20utility%20steps.html 常用环境变量 含义表达式备注params,传入参数传入参数params…...
staruml绘制时序图和用例图
文章目录 1.文章介绍2.绘制用例图3.绘制时序图 1.文章介绍 之前,我们初步介绍了这个staruml软件的安装和如何使用这个软件对于uml类图进行绘制,当时我们是绘制了这个user类,实现了相关的接口,表示他们之间的关系,在今…...
问题修复-后端返给前端的时间展示错误
问题现象: 后端给前端返回的时间展示有问题。 需要按照yyyy-MM-dd HH:mm:ss 的形式展示 两种办法: 第一种 在实体类的属性上添加JsonFormat注解 第二种(建议使用) 扩展mvc框架中的消息转换器 代码: 因为配置类继…...
Rust配置开发环境+服务器实战
https://www.cnblogs.com/skzxc/p/12129353.html 默认已经安装好MSVC。 官网https://www.rust-lang.org/zh-CN/learn/get-started安装Rust安装器,选择winodwsx64版本 运行安装,将文件夹移动到D盘,安装后,文件夹在C:\Users\xxx下…...
使用DeepSeek+KIMI生成高质量PPT
一、使用DeepSeek DeepSeek官网:DeepSeek 点击“开始对话”,进入交互页面。 在上图中,输入问题,即可获取AI生成的结果。 基础模型(V3):通用模型(2024.12),高…...
虚拟机如何设置ip
在虚拟机中设置IP地址的具体步骤会因虚拟机软件(如VMware、VirtualBox等)和操作系统(如Windows、Linux等)的不同而有所差异。以下是几种常见虚拟机软件和操作系统的IP设置方法。 --- 一、VMware中的IP设置 1.Windows虚拟机 1. 打…...
蓝桥杯 路径之谜
路径之谜 题目描述 小明冒充 XX 星球的骑士,进入了一个奇怪的城堡。 城堡里边什么都没有,只有方形石头铺成的地面。 假设城堡地面是 nnnn 个方格。如下图所示。 按习俗,骑士要从西北角走到东南角。可以横向或纵向移动,但不能斜着走…...
Git操作指南:分支合并、回退及其他重要操作
在软件开发的协作过程中,Git 作为一款强大的版本控制系统,能帮助开发者高效管理代码的各个版本和分支。本文将详细介绍 Git 中常见的分支合并、取消本地修改、回退操作等,并提供通俗易懂的解释和步骤指南。 一、分支合并 分支合并是 Git 工…...
Element Plus中el-tree点击的节点字体变色加粗
el-tree标签设置 <el-tree class"tree":data"treeData":default-expand-all"true":highlight-current"true"node-click"onTreeNodeClick"><!-- 自定义节点内容,点击的节点字体变色加粗 --><!-- 动…...
jenkens使用笔记
jenkens使用笔记 笔记使用版本是2.492.1 git仓库ssh证书配置 已开始配置一直不行,然后下载插件,多次重启等一些列操作, 后来配置就可以工作了,原因不祥,不知道哪个配置起效了。 等回来闹明白了,再补充笔记…...
腾讯混元文生图大模型(Hunyuan-DiT)与Stable Diffusion(SD)对比分析
腾讯混元文生图大模型(Hunyuan-DiT)与Stable Diffusion(SD)对比分析 腾讯混元文生图大模型(Hunyuan-DiT)与Stable Diffusion(SD)作为当前文生图领域的两大代表模型,各自…...
深入浅出理解编译器:前端视角
一、编译器究竟是什么? 在前端开发的世界里,我们经常会听到 “编译器” 这个词。就拿 Babel 来说,在它的官网上,最显眼的一句话就是:“Babel is a JavaScript compiler”。那什么是 JavaScript 编译器呢?又…...
Minio搭建并在SpringBoot中使用完成用户头像的上传
Minio使用搭建并上传用户头像到服务器操作,学习笔记 Minio介绍 minio官网 MinIO是一个开源的分布式对象存储服务器,支持S3协议并且可以在多节点上实现数据的高可用和容错。它采用Go语言开发,拥有轻量级、高性能、易部署等特点,并且可以自由…...
Ubuntu系统上部署Node.js项目的完整流程
以下是在Ubuntu系统上部署Node.js项目的完整流程,分为系统初始化、环境配置、项目部署三个部分: 一、系统初始化 & 环境准备 bash # 1. 更新系统软件包 sudo apt update && sudo apt upgrade -y# 2. 安装基础工具 sudo apt install -y buil…...
DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?
嘿,技术小伙伴们!今天咱们聊聊最近在AI界引发轰动的新闻——DeepSeek和xAI相继用R1和Grok-3证明了预训练Scaling Law并非OpenAI的护城河。这意味着什么呢?让我们一探究竟! 开场白 首先,让我们看看最新的“全能冠军”…...
【知识】torchrun 与 torch.multiprocessing.spawn 的对比
转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn] 如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~ 来自ChatGPT、DeepSeek 有点干,可仅做了解。 torchrun 和 torch.multiprocessing.spawn 都是在 PyTorch 中用于并行化和分布式训练的工具&a…...
深入了解 K-Means 聚类算法:原理与应用
引言 在数据科学和机器学习的世界中,聚类是一项非常重要的技术,它帮助我们根据数据的相似性将数据划分为不同的组或簇。聚类算法在许多领域中得到了广泛的应用,如图像处理、市场细分、基因研究等。K-Means 聚类算法作为最常见的无监督学习算…...
网络编程(Modbus进阶)
思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…...
DeepSeek 赋能智慧能源:微电网优化调度的智能革新路径
目录 一、智慧能源微电网优化调度概述1.1 智慧能源微电网概念1.2 优化调度的重要性1.3 目前面临的挑战 二、DeepSeek 技术探秘2.1 DeepSeek 技术原理2.2 DeepSeek 独特优势2.3 DeepSeek 在 AI 领域地位 三、DeepSeek 在微电网优化调度中的应用剖析3.1 数据处理与分析3.2 预测与…...
rknn优化教程(二)
文章目录 1. 前述2. 三方库的封装2.1 xrepo中的库2.2 xrepo之外的库2.2.1 opencv2.2.2 rknnrt2.2.3 spdlog 3. rknn_engine库 1. 前述 OK,开始写第二篇的内容了。这篇博客主要能写一下: 如何给一些三方库按照xmake方式进行封装,供调用如何按…...
在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能
下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能,包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...
边缘计算医疗风险自查APP开发方案
核心目标:在便携设备(智能手表/家用检测仪)部署轻量化疾病预测模型,实现低延迟、隐私安全的实时健康风险评估。 一、技术架构设计 #mermaid-svg-iuNaeeLK2YoFKfao {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg…...
2021-03-15 iview一些问题
1.iview 在使用tree组件时,发现没有set类的方法,只有get,那么要改变tree值,只能遍历treeData,递归修改treeData的checked,发现无法更改,原因在于check模式下,子元素的勾选状态跟父节…...
Robots.txt 文件
什么是robots.txt? robots.txt 是一个位于网站根目录下的文本文件(如:https://example.com/robots.txt),它用于指导网络爬虫(如搜索引擎的蜘蛛程序)如何抓取该网站的内容。这个文件遵循 Robots…...
CMake控制VS2022项目文件分组
我们可以通过 CMake 控制源文件的组织结构,使它们在 VS 解决方案资源管理器中以“组”(Filter)的形式进行分类展示。 🎯 目标 通过 CMake 脚本将 .cpp、.h 等源文件分组显示在 Visual Studio 2022 的解决方案资源管理器中。 ✅ 支持的方法汇总(共4种) 方法描述是否推荐…...
html css js网页制作成品——HTML+CSS榴莲商城网页设计(4页)附源码
目录 一、👨🎓网站题目 二、✍️网站描述 三、📚网站介绍 四、🌐网站效果 五、🪓 代码实现 🧱HTML 六、🥇 如何让学习不再盲目 七、🎁更多干货 一、👨…...
让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比
在机器学习的回归分析中,损失函数的选择对模型性能具有决定性影响。均方误差(MSE)作为经典的损失函数,在处理干净数据时表现优异,但在面对包含异常值的噪声数据时,其对大误差的二次惩罚机制往往导致模型参数…...
