当前位置：首页 > news >正文

算法训练day2：哈希表

news 2026/2/10 11:15:08

哈希表理论基础

哈希表是根据关键码的值而直接进行访问的数据结构。

当我们遇到了要快速判断一个元素是否出现集合里的时候，就要考虑哈希法。

但是哈希法也是牺牲了空间换取了时间，因为我们要使用额外的数组，set或者是map来存放数据，才能实现快速的查找。

如果在做面试题目的时候遇到需要判断一个元素是否出现过的场景也应该第一时间想到哈希法！

常见的三种哈希结构

当我们想使用哈希法来解决问题的时候，我们一般会选择如下三种数据结构。

数组
set （集合）
map(映射)

这里数组就没啥可说的了，我们来看一下set。

在C++中，set 和 map 分别提供以下三种数据结构，其底层实现以及优劣如下表所示：

std::unordered_set底层实现为哈希表，std::set 和std::multiset 的底层实现是红黑树，红黑树是一种平衡二叉搜索树，所以key值是有序的，但key不可以修改，改动key值会导致整棵树的错乱，所以只能删除和增加。

std::unordered_map 底层实现为哈希表，std::map 和std::multimap 的底层实现是红黑树。同理，std::map 和std::multimap 的key也是有序的（这个问题也经常作为面试题，考察对语言容器底层的理解）。

当我们要使用集合来解决哈希问题的时候，优先使用unordered_set，因为它的查询和增删效率是最优的，如果需要集合是有序的，那么就用set，如果要求不仅有序还要有重复数据的话，那么就用multiset。

那么再来看一下map ，在map 是一个key value 的数据结构，map中，对key是有限制，对value没有限制的，因为key的存储方式使用红黑树实现的。

其他语言例如：java里的HashMap ，TreeMap 都是一样的原理。可以灵活贯通。

虽然std::set、std::multiset 的底层实现是红黑树，不是哈希表，std::set、std::multiset 使用红黑树来索引和存储，不过给我们的使用方式，还是哈希法的使用方式，即key和value。所以使用这些数据结构来解决映射问题的方法，我们依然称之为哈希法。 map也是一样的道理。

这里在说一下，一些C++的经典书籍上例如STL源码剖析，说到了hash_set hash_map，这个与unordered_set，unordered_map又有什么关系呢？

实际上功能都是一样一样的，但是unordered_set在C++11的时候被引入标准库了，而hash_set并没有，所以建议还是使用unordered_set比较好，这就好比一个是官方认证的，hash_set，hash_map 是C++11标准之前民间高手自发造的轮子。

242:有效字母的异位词

class Solution {
public:bool isAnagram(string s, string t) {int record[26] = {0};for (int i = 0; i < s.size(); i++) {record[s[i] - 97]++;}for (int i = 0; i < t.size(); i++) {record[t[i] - 97]--;}for (int i = 0; i < 26; i++) {if (record[i] != 0) {return false;}}return true;}
};

349:两个数组的交集

使用数组做哈希表

class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {unordered_set<int> result_set; // 存放结果，之所以用set是为了给结果集去重int hash[1005] = {0}; // 默认数值为0for (int num : nums1) { // nums1中出现的字母在hash数组中做记录hash[num] = 1;}for (int num : nums2) { // nums2中出现话，result记录if (hash[num] == 1) {result_set.insert(num);}}return vector<int>(result_set.begin(), result_set.end());}
};

使用unordered_set

class Solution {
public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {unordered_set<int> result_set; // 存放结果，之所以用set是为了给结果集去重unordered_set<int> nums_set(nums1.begin(), nums1.end());for (int num : nums2) {// 发现nums2的元素 在nums_set里又出现过if (nums_set.find(num) != nums_set.end()) {result_set.insert(num);}}return vector<int>(result_set.begin(), result_set.end());}
};

202:快乐数

class Solution {
public:int getSum(int n){int sum = 0;while(n){sum += (n % 10) * (n % 10);n /= 10;}return sum;}bool isHappy(int n) {unordered_set<int>set;while(1){int sum = getSum(n);if(sum == 1){return true;}if(set.find(sum) != set.end()){return false;}else{set.insert(sum);}n = sum;}}
};

1:两数之和

map方法

class Solution {
public:vector<int> twoSum(vector<int>& nums, int target) {unordered_map<int,int>map;for(int i = 0;i<nums.size();i++){auto tmp = map.find(target - nums[i]);if(tmp != map.end()){return {tmp->second,i};}else{map.insert(pair<int, int>(nums[i], i));}}return {};}
};

454:四数相加

class Solution {
public:int fourSumCount(vector<int>& nums1, vector<int>& nums2, vector<int>& nums3, vector<int>& nums4) {unordered_map<int, int> umap; //key:a+b的数值，value:a+b数值出现的次数for (int a :nums1) {for (int b : nums2) {umap[a + b]++;}}int count = 0; for (int c : nums3) {for (int d : nums4) {if (umap.find(0 - (c + d)) != umap.end()) {count += umap[0 - (c + d)];}}}return count;}
};

15:三数之和（没搞明白，有哈希和双指针两种办法，下面是双指针法）

class Solution {
public:vector<vector<int>> threeSum(vector<int>& nums) {vector<vector<int>> result;sort(nums.begin(), nums.end());// 找出a + b + c = 0// a = nums[i], b = nums[left], c = nums[right]for (int i = 0; i < nums.size(); i++) {// 排序之后如果第一个元素已经大于零，那么无论如何组合都不可能凑成三元组，直接返回结果就可以了if (nums[i] > 0) {return result;}// 错误去重a方法，将会漏掉-1,-1,2 这种情况/*if (nums[i] == nums[i + 1]) {continue;}*/// 正确去重a方法if (i > 0 && nums[i] == nums[i - 1]) {continue;}int left = i + 1;int right = nums.size() - 1;while (right > left) {// 去重复逻辑如果放在这里，0，0，0 的情况，可能直接导致 right<=left 了，从而漏掉了 0,0,0 这种三元组/*while (right > left && nums[right] == nums[right - 1]) right--;while (right > left && nums[left] == nums[left + 1]) left++;*/if (nums[i] + nums[left] + nums[right] > 0) right--;else if (nums[i] + nums[left] + nums[right] < 0) left++;else {result.push_back(vector<int>{nums[i], nums[left], nums[right]});// 去重逻辑应该放在找到一个三元组之后，对b 和 c去重while (right > left && nums[right] == nums[right - 1]) right--;while (right > left && nums[left] == nums[left + 1]) left++;// 找到答案时，双指针同时收缩right--;left++;}}}return result;}
};

使用数组和set来做哈希法的局限。

数组的大小是受限制的，而且如果元素很少，而哈希值太大会造成内存空间的浪费。
set是一个集合，里面放的元素只能是一个key，而两数之和这道题目，不仅要判断y是否存在而且还要记录y的下标位置，因为要返回x 和 y的下标。所以set 也不能用。

map是一种<key, value>的结构，本题可以用key保存数值，用value在保存数值所在的下标。所以使用map最为合适。

C++提供如下三种map：：（详情请看关于哈希表，你该了解这些！ (opens new window)）

std::map
std::multimap
std::unordered_map

std::unordered_map 底层实现为哈希，std::map 和std::multimap 的底层实现是红黑树。

同理，std::map 和std::multimap 的key也是有序的（这个问题也经常作为面试题，考察对语言容器底层的理解），1.两数之和 (opens new window)中并不需要key有序，选择std::unordered_map 效率更高！

算法训练day2：哈希表

哈希表理论基础

常见的三种哈希结构

相关文章：

算法训练day2：哈希表

Git——利用SSH密钥本地仓库上传远程GitHub库

一起读源码 —— Fastjson 的核心方法及其实现原理

Python实现批量图片下载及去重处理

【QA】Python代码调试之解决Segmentation fault (core dumped)问题

C++ 迭代器之旅（Journey of Iterators）

使用全球融合CDN的10大优势

前端学习：HTML图像、表格、列表

202305读书笔记｜《因思念而沉着》——任何赞美都是身外之物唯自由可随身携带

M1 M2上能安装上Autocad 2024 Mac 中文版吗 autocad m1 m2版本有啦终于支持Ventura 13x了

【题解】P4055 [JSOI2009] 游戏

P1020 [NOIP1999 普及组] 导弹拦截

Makefile学习

2.4 随机变量函数的分布

数据结构【一】：前缀表达式与后缀表达式的区别

搭建 PostgreSQL

Nmap入门到高级【第四章】

c++正则表达式及其使用，超级详细

【LeetCode: 剑指 Offer II 099. 最小路径之和 | 暴力递归 | DFS =＞记忆化搜索=＞动态规划】

Python OpenCV 计算机视觉：6~7

web vue 项目 Docker化部署

三维GIS开发cesium智慧地铁教程（5）Cesium相机控制

【入坑系列】TiDB 强制索引在不同库下不生效问题

IGP（Interior Gateway Protocol，内部网关协议）

基于服务器使用 apt 安装、配置 Nginx

解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错

中医有效性探讨

浪潮交换机配置track检测实现高速公路收费网络主备切换NQA

人机融合智能 | “人智交互”跨学科新领域

虚拟电厂发展三大趋势：市场化、技术主导、车网互联