当前位置: 首页 > article >正文

手撕哈希表(Hash Table):从原理到C++完整实现

手撕哈希表Hash Table从原理到C完整实现哈希表作为O(1)级别查找的数据结构是面试与工程开发中的高频考点。本文从哈希核心概念讲起深入哈希函数、哈希冲突、两种冲突解决方案并提供可直接运行的C完整代码带你彻底吃透哈希表。文章目录手撕哈希表Hash Table从原理到C完整实现一、哈希表核心概念1.1 什么是哈希1.2 直接定址法1.3 哈希冲突1.4 负载因子1.5 关键字转整数二、哈希函数设计2.1 除法散列法最常用2.2 乘法散列法2.3 全域散列法三、哈希冲突解决方案3.1 开放定址法3.1.1 线性探测3.1.2 二次探测3.1.3 双重散列3.2 链地址法哈希桶工程首选四、C完整实现4.1 通用哈希仿函数4.2 开放定址法线性探测完整代码4.3 链地址法哈希桶完整代码五、测试代码六、总结一、哈希表核心概念1.1 什么是哈希哈希Hash又称散列通过哈希函数建立关键字Key与存储位置的映射关系实现数据的快速插入、查找、删除理想时间复杂度为O(1)。1.2 直接定址法关键字范围集中时的极简哈希方式关键字为[0,99]整数直接用关键字作为数组下标关键字为小写字母下标 字符ASCII码 - a的ASCII码示例LeetCode 387. 字符串中的第一个唯一字符classSolution{public:intfirstUniqChar(string s){// 用字母相对ASCII码作为下标统计字符出现次数intcount[26]{0};for(autoch:s){count[ch-a];}// 遍历找第一个出现一次的字符for(size_t i0;is.size();i){if(count[s[i]-a]1){returni;}}return-1;}};1.3 哈希冲突不同关键字通过哈希函数计算出相同存储位置称为哈希冲突哈希碰撞。冲突无法完全避免只能通过优秀哈希函数减少冲突并设计冲突解决方案。1.4 负载因子负载因子 哈希表中元素个数 / 哈希表大小负载因子越大冲突概率越高空间利用率越高负载因子越小冲突概率越低空间利用率越低1.5 关键字转整数非整数类型如string、自定义类型需先转为整数再进行哈希计算。二、哈希函数设计哈希函数核心目标让关键字均匀散列到哈希表中减少冲突。2.1 除法散列法最常用公式h(key) key % MM为哈希表大小建议M取不接近2的整数次幂的质数避免后几位固定导致大量冲突Java HashMap优化M取2的整数次幂用位运算替代取模同时让key所有位参与计算2.2 乘法散列法公式h(key) floor(M × ((A × key) % 1.0))A取黄金分割比(√5-1)/2 ≈ 0.618对表大小M无要求2.3 全域散列法随机选择哈希函数防止恶意构造数据导致极端冲突公式h_ab(key) ((a × key b) % P) % MP为大质数a∈[1,P-1]b∈[0,P-1]三、哈希冲突解决方案3.1 开放定址法所有元素存储在哈希表数组中冲突时按规则寻找空位置负载因子必须1。3.1.1 线性探测冲突后依次向后探测公式hashi (hash0 i) % Mi1,2,3…优点实现简单缺点易产生数据堆积查找效率下降3.1.2 二次探测冲突后按平方数跳跃探测公式hashi (hash0 ± i²) % M优点缓解线性探测的堆积问题3.1.3 双重散列用第二个哈希函数计算偏移量公式hashi (hash0 i × h2(key)) % M要求h2(key)与M互质保证遍历全表3.2 链地址法哈希桶工程首选哈希表存储链表指针冲突元素挂在对应位置的链表上负载因子可1。优点无堆积问题实现简单效率稳定Java8 HashMap优化链表长度8转为红黑树进一步提升效率四、C完整实现4.1 通用哈希仿函数支持int、string等类型转整数string采用BKDR哈希减少冲突// 通用哈希仿函数templateclassKstructHashFunc{size_toperator()(constKkey){return(size_t)key;}};// string特化BKDR哈希templatestructHashFuncstring{size_toperator()(conststringkey){size_t hash0;for(autoch:key){hashhash*131ch;// 131为优质质数}returnhash;}};// SGI STL质数表扩容用inlineunsignedlong__stl_next_prime(unsignedlongn){staticconstint__stl_num_primes28;staticconstunsignedlong__stl_prime_list[__stl_num_primes]{53,97,193,389,769,1543,3079,6151,12289,24593,49157,98317,196613,393241,786433,1572869,3145739,6291469,12582917,25165843,50331653,100663319,201326611,402653189,805306457,1610612741,3221225473,4294967291};constunsignedlong*first__stl_prime_list;constunsignedlong*last__stl_prime_list__stl_num_primes;constunsignedlong*poslower_bound(first,last,n);returnposlast?*(last-1):*pos;}4.2 开放定址法线性探测完整代码namespaceopen_address{// 节点状态存在/空/已删除enumState{EXIST,EMPTY,DELETE};// 哈希节点templateclassK,classVstructHashData{pairK,V_kv;State _stateEMPTY;};// 开放定址哈希表templateclassK,classV,classHashHashFuncKclassHashTable{public:HashTable(){_tables.resize(__stl_next_prime(0));}// 插入boolInsert(constpairK,Vkv){if(Find(kv.first)){returnfalse;}// 负载因子0.7扩容if(_n*10/_tables.size()7){HashTableK,V,HashnewHT;newHT._tables.resize(__stl_next_prime(_tables.size()1));// 旧数据重新映射到新表for(size_t i0;i_tables.size();i){if(_tables[i]._stateEXIST){newHT.Insert(_tables[i]._kv);}}_tables.swap(newHT._tables);}Hash hash;size_t hash0hash(kv.first)%_tables.size();size_t hashihash0;size_t i1;// 线性探测找空位置while(_tables[hashi]._stateEXIST){hashi(hash0i)%_tables.size();i;}// 插入数据_tables[hashi]._kvkv;_tables[hashi]._stateEXIST;_n;returntrue;}// 查找HashDataK,V*Find(constKkey){Hash hash;size_t hash0hash(key)%_tables.size();size_t hashihash0;size_t i1;// 遇到EMPTY停止查找while(_tables[hashi]._state!EMPTY){if(_tables[hashi]._stateEXIST_tables[hashi]._kv.firstkey){return_tables[hashi];}hashi(hash0i)%_tables.size();i;}returnnullptr;}// 删除标记删除不实际移除boolErase(constKkey){HashDataK,V*retFind(key);if(retnullptr){returnfalse;}ret-_stateDELETE;--_n;returntrue;}private:vectorHashDataK,V_tables;size_t _n0;// 有效元素个数};}4.3 链地址法哈希桶完整代码namespacehash_bucket{// 链表节点templateclassK,classVstructHashNode{pairK,V_kv;HashNodeK,V*_next;HashNode(constpairK,Vkv):_kv(kv),_next(nullptr){}};// 链地址哈希表templateclassK,classV,classHashHashFuncKclassHashTable{typedefHashNodeK,VNode;public:HashTable(){_tables.resize(__stl_next_prime(0),nullptr);}// 析构释放所有节点~HashTable(){for(size_t i0;i_tables.size();i){Node*cur_tables[i];while(cur){Node*nextcur-_next;deletecur;curnext;}_tables[i]nullptr;}}// 插入头插boolInsert(constpairK,Vkv){if(Find(kv.first)){returnfalse;}Hash hs;size_t hashihs(kv.first)%_tables.size();// 负载因子1扩容if(_n_tables.size()){vectorNode*newTables(__stl_next_prime(_tables.size()1),nullptr);// 旧节点直接移动到新表高效for(size_t i0;i_tables.size();i){Node*cur_tables[i];while(cur){Node*nextcur-_next;// 重新计算哈希位置size_t newHashhs(cur-_kv.first)%newTables.size();// 头插新表cur-_nextnewTables[newHash];newTables[newHash]cur;curnext;}_tables[i]nullptr;}_tables.swap(newTables);// 重新计算插入位置hashihs(kv.first)%_tables.size();}// 头插法插入新节点Node*newNodenewNode(kv);newNode-_next_tables[hashi];_tables[hashi]newNode;_n;returntrue;}// 查找Node*Find(constKkey){Hash hs;size_t hashihs(key)%_tables.size();Node*cur_tables[hashi];// 遍历对应链表while(cur){if(cur-_kv.firstkey){returncur;}curcur-_next;}returnnullptr;}// 删除boolErase(constKkey){Hash hs;size_t hashihs(key)%_tables.size();Node*prevnullptr;Node*cur_tables[hashi];while(cur){if(cur-_kv.firstkey){// 头节点删除if(prevnullptr){_tables[hashi]cur-_next;}else{// 中间/尾节点删除prev-_nextcur-_next;}deletecur;--_n;returntrue;}prevcur;curcur-_next;}returnfalse;}private:vectorNode*_tables;// 指针数组哈希桶size_t _n0;// 有效元素个数};}五、测试代码intmain(){// 测试链地址法哈希表hash_bucket::HashTableint,stringht;ht.Insert(make_pair(1,one));ht.Insert(make_pair(2,two));ht.Insert(make_pair(3,three));// 查找测试autonodeht.Find(2);if(node){coutkey:2 value:node-_kv.secondendl;}// 删除测试ht.Erase(2);nodeht.Find(2);if(!node){coutkey:2 删除成功endl;}// 测试string类型hash_bucket::HashTablestring,intstrHT;strHT.Insert(make_pair(hash,100));strHT.Insert(make_pair(table,200));autostrNodestrHT.Find(hash);if(strNode){coutkey:hash value:strNode-_kv.secondendl;}return0;}六、总结哈希表核心哈希函数冲突解决目标O(1)查找哈希函数除法散列法最常用string推荐BKDR哈希冲突解决开放定址法实现简单易堆积负载因子1链地址法工程首选无堆积支持负载因子1扩容哈希表大小取质数负载因子达到阈值自动扩容本文实现的哈希表可直接用于学习与面试理解原理后可轻松掌握unordered_map/unordered_set底层逻辑。

相关文章:

手撕哈希表(Hash Table):从原理到C++完整实现

手撕哈希表(Hash Table):从原理到C完整实现 哈希表作为O(1)级别查找的数据结构,是面试与工程开发中的高频考点。本文从哈希核心概念讲起,深入哈希函数、哈希冲突、两种冲突解决方案,并提供可直接运行的C完…...

AI净界RMBG-1.4场景应用:如何快速制作电商透明背景主图

AI净界RMBG-1.4场景应用:如何快速制作电商透明背景主图 1. 电商主图制作的痛点与解决方案 在电商运营中,商品主图的质量直接影响点击率和转化率。传统制作透明背景主图的方法通常需要设计师使用Photoshop等专业工具,通过钢笔工具、魔棒等手…...

markitdown:微软出的「万物转Markdown」工具,内容提取效率翻倍

markitdown:微软出的「万物转Markdown」工具,内容提取效率翻倍 做内容的人每天要处理各种格式的文件:PDF报告、Word文档、PPT、Excel表格、图片中的文字…… 以前要么手动复制,要么专门找工具转换,效率极低。微软开源了…...

Xinference-v1.17.1在Java开发中的模型调用最佳实践

Xinference-v1.17.1在Java开发中的模型调用最佳实践 1. 引言 在电商推荐系统的开发过程中,我们经常需要处理海量的用户行为数据和商品信息。传统的推荐算法往往难以捕捉用户的深层兴趣,而AI大模型的出现为个性化推荐带来了新的可能。Xinference-v1.17.…...

OFA视觉蕴含模型实操手册:结果可解释性增强——注意力热力图可视化

OFA视觉蕴含模型实操手册:结果可解释性增强——注意力热力图可视化 1. 项目概述 OFA视觉蕴含模型是一个强大的多模态AI系统,能够智能分析图像内容与文本描述之间的语义关系。简单来说,它能判断一张图片和一段文字是否匹配,就像一…...

上拉/下拉电阻原理、选型与避坑全解:90%硬件新手都栽在这5个地方

摘要 本文针对数字电路中高频引发稳定性问题的上拉/下拉电阻展开讲解,明确其解决高阻态电平不确定的核心作用,提供分场景选型公式与实测参考值,对比内部与外部上拉的适用边界,梳理5个致命设计误区,给出STM32 HAL库标准…...

Go + Redis 实现可恢复的 LLM 流式推送:断线不丢数据的实战方案

做 LLM 流式输出的时候,用户刷新一下页面流就断了,后端还在跑,token 白烧。本文分享一种基于 Redis Streams 的断线续传方案,附完整 Go 代码。 一、问题背景 最近做了一个 AI 对话服务,后端 Go,LLM 输出通…...

技术实战:基于CLI与AgentSkill 构建工业级AI影视解说自动化链路

一、 AI影视解说新范式:从工具堆砌到自动化 Pipeline 演进 进入 2026 年,短视频生产已从单纯的“工具使用”进入到“工程化自动生产”阶段。传统的 GUI(图形界面)工具虽然易上手,但在面对大规模账号矩阵运营、高频内容…...

2026年本地geo推广服务商大盘点,这些你都知道吗?

在当今数字化营销的浪潮中,本地GEO推广服务正扮演着愈发重要的角色。随着市场竞争的加剧,企业对于精准营销和高效推广的需求也日益增长。GEO推广能够根据地理位置信息,将企业的广告精准地推送给目标客户,从而提高营销效果和投资回…...

做了5年软考班主任,我发现能一次上岸的学员,都有这3个共同点

从业5年,带过超过3000名高项学员。每年成绩出来,我都会做一次复盘:那些一次上岸的学员,到底做对了什么?5年的数据告诉我,能一次通过软考高项的学员,跟学历、年龄、专业背景关系不大。他们唯一的…...

OpenEuler 硬盘挂载

一、背景说明 CentOS 停止维护后,选择安装 OpenEuler(欧拉)系统 服务器配置:512G SSD(安装系统) 1T 机械硬盘(存储数据)目标:SSD 运行系统,机械硬盘存储数据 …...

Golang如何部署到Kubernetes_Golang K8s部署教程【推荐】

Go服务在Kubernetes中启动失败的四大主因是:监听地址必须为0.0.0.0或空host;Deployment中selector.matchLabels与template.labels必须逐字一致;必须配置readinessProbe和livenessProbe并实现对应HTTP路径;CGO_ENABLED0是Alpine/sc…...

DeepSeek-R1-Distill-Qwen-7B入门实战:从零开始搭建推理环境

DeepSeek-R1-Distill-Qwen-7B入门实战:从零开始搭建推理环境 1. 环境准备与快速部署 1.1 系统要求 在开始部署DeepSeek-R1-Distill-Qwen-7B模型前,请确保您的系统满足以下基本要求: 操作系统:推荐使用Linux系统(Ub…...

李佳琦后退,美ONE在赌一场没有“顶流”的未来

超头退潮下,MCN的生死命题。文|段泽钰编|郭梦仪4月8日,李佳琦在直播中宣布“将缺席两个月的直播”。几个小时后,这条消息登上热搜。他不得不紧急澄清:是两个月,不是两个季度,缺席是去…...

酷狗音乐API深度解析:5大核心技术构建完整的音乐服务生态

酷狗音乐API深度解析:5大核心技术构建完整的音乐服务生态 【免费下载链接】KuGouMusicApi 酷狗音乐 Node.js API service 项目地址: https://gitcode.com/gh_mirrors/ku/KuGouMusicApi KuGouMusicApi 是一个基于Node.js的酷狗音乐API服务,为开发者…...

Step3-VL-10B-Base从零开始:C语言基础与模型底层调用原理

Step3-VL-10B-Base从零开始:C语言基础与模型底层调用原理 1. 引言 你可能已经用过不少AI模型,点几下按钮,输入一段文字,图片或者视频就生成了。但有没有想过,当你点击“生成”按钮后,电脑内部到底发生了什…...

DAMOYOLO-S检测展示:支持PNG透明通道输入,保留原始Alpha信息输出

DAMOYOLO-S检测展示:支持PNG透明通道输入,保留原始Alpha信息输出 1. 引言:当目标检测遇上透明背景 想象一下,你是一位游戏美术设计师,需要从一张带有复杂透明背景的角色立绘中,精准地识别出角色、武器、宠…...

3步实现《重返未来:1999》智能托管:M9A助手如何让你每天节省2小时游戏时间

3步实现《重返未来:1999》智能托管:M9A助手如何让你每天节省2小时游戏时间 【免费下载链接】M9A 重返未来:1999 小助手 | Assistant For Reverse: 1999 项目地址: https://gitcode.com/gh_mirrors/m9/M9A 还在为《重返未来&#xff1a…...

文脉定序环境部署:适配中小企业知识库的轻量级重排序服务搭建指南

文脉定序环境部署:适配中小企业知识库的轻量级重排序服务搭建指南 1. 引言:为什么中小企业需要智能重排序? 在日常工作中,你是否遇到过这样的困扰:公司知识库明明有相关文档,但搜索出来的结果总是差强人意…...

前端组件设计原则

在当今快速发展的前端开发领域,组件化已成为构建高效、可维护应用的核心手段。前端组件设计原则不仅提升了代码复用性,还优化了团队协作效率。无论是大型企业级应用还是轻量级项目,良好的组件设计都能显著降低维护成本。本文将深入探讨几个关…...

人工智能之知识蒸馏 第三章 知识类型分类与蒸馏对象选择策略

人工智能之知识蒸馏 第三章 知识类型分类与蒸馏对象选择策略 文章目录人工智能之知识蒸馏前言3.1 核心知识类型分类(按蒸馏对象划分)3.1.1 输出特征蒸馏(基础型蒸馏)3.1.2 中间特征蒸馏(进阶型蒸馏)3.1.3 …...

Zend VM直接运行PHP代码出结果就不需要CPU了?

答案是:绝对需要 CPU。而且是非常大量的 CPU。 这是一个非常危险的误解。如果 Zend VM 运行不需要 CPU,那它就是在用“爱”发电,或者是在施展魔法。 真相是:Zend VM 本身就是一段巨大的、复杂的 C 语言程序。这段 C 语言程序必须被…...

GME-Qwen2-VL-2B-Instruct开发入门:Git版本控制与团队协作实践

GME-Qwen2-VL-2B-Instruct开发入门:Git版本控制与团队协作实践 如果你刚开始接触GME-Qwen2-VL-2B-Instruct这类多模态大模型项目,可能会觉得有点手忙脚乱。模型文件、配置文件、推理脚本、数据集……文件又多又杂,今天改一点代码&#xff0c…...

【2026奇点智能技术大会权威解码】:多模态导航如何重构LBS服务底层逻辑?

第一章:2026奇点智能技术大会:多模态导航应用 2026奇点智能技术大会(https://ml-summit.org) 多模态导航正从实验室走向城市级基础设施,2026奇点智能技术大会首次系统展示了融合视觉、语音、LiDAR与高精语义地图的端到端导航框架。该框架在东…...

SDMatte提示词(Prompt)工程:如何描述图片以获得更好抠图效果

SDMatte提示词(Prompt)工程:如何描述图片以获得更好抠图效果 1. 为什么提示词对抠图很重要 你可能觉得奇怪,一个抠图工具为什么需要关注提示词?其实在SDMatte这类智能抠图模型中,文字描述就像给模型的一张…...

AI 3D内容生成全攻略:从建模到渲染,一站式搞定商用需求

AI 3D内容生成全流程解析建模阶段:快速生成基础模型AI驱动的建模工具(如Kaedim、Masterpiece Studio)可通过文本或2D图像生成3D模型,大幅降低传统多边形建模的时间成本。以Blender为例,可搭配AI插件(如AI M…...

Python第三课: 基础语法(2):顺序、条件、循环全攻略+人生重开模拟器

Python第三课: 基础语法(2):顺序、条件、循环全攻略人生重开模拟器 文章目录Python第三课: 基础语法(2):顺序、条件、循环全攻略人生重开模拟器一、顺序语句:代码从上往下执行二、条件语句&…...

万物识别-中文-通用领域镜像与Linux安装教程结合:系统部署指南

万物识别-中文-通用领域镜像与Linux安装教程结合:系统部署指南 你是不是也遇到过这样的场景:手头有一堆图片,想快速知道里面都有什么东西,但一个个去查、去搜又太费时间?或者,你想给自己的应用加上一个“智…...

SeqGPT-560M多场景:物联网设备日志中自动提取错误码、时间戳、模块名、原因描述

SeqGPT-560M多场景:物联网设备日志中自动提取错误码、时间戳、模块名、原因描述 1. 项目简介 SeqGPT-560M是一个专门为企业级智能信息抽取设计的定制化系统。与常见的聊天对话模型不同,这个系统专注于一件事:从复杂的非结构化文本中精准提取…...

【智能家居奇点倒计时】:仅剩18个月!2026大会认证的7个必须升级的多模态交互协议

第一章:2026奇点智能技术大会:多模态智能家居 2026奇点智能技术大会(https://ml-summit.org) 多模态融合架构设计 本届大会首次公开了开源多模态家居中枢框架HomeFusion v2.1,其核心采用统一嵌入空间(Unified Embedding Space&a…...