当前位置: 首页 > article >正文

Redis 布隆过滤器使用深入分析

Redis 布隆过滤器使用深入分析布隆过滤器是一种概率型数据结构,它用极小的内存空间换取了“告诉你某个元素一定不存在或可能存在”的能力。在 Redis 生态中,布隆过滤器通过 RedisBloom 模块实现,已成为解决缓存穿透、海量数据去重等问题的标准方案。一、核心原理:为什么布隆过滤器“小又快”1.1 数据结构本质布隆过滤器底层是一个位数组(Bit Array),初始状态所有位都是0。它不存储元素本身,而是存储元素的哈希指纹。1.2 添加元素的过程当向布隆过滤器中添加一个元素时:使用K 个独立的哈希函数对元素进行计算每个哈希函数计算出位数组中的一个位置(下标)将这 K 个位置的位都设置为11.3 查询元素的过程查询时,同样计算 K 个哈希位置:如果所有位置都是 1→ 元素可能存在(有误判概率)如果有任何一个位置是 0→ 元素一定不存在为什么“可能存在”会误判?因为某个位可能被其他元素的哈希“污染”了。例如,元素 A 将位 5 和 7 设为 1,元素 B 将位 7 和 12 设为 1。查询元素 C(需要位 5、7、12 全为 1)时,这三个位恰好都被其他元素设置过,就会产生假阳性(False Positive)。1.4 确定性结论查询结果实际含义确定性不存在(0)元素一定不在集合中✅ 100% 确定可能存在(1)元素可能在集合中⚠️ 有一定误判率这是布隆过滤器最核心的特性:宁可错杀一千(误判存在),绝不放过一个(不会漏判不存在)。二、Redis 布隆过滤器的核心命令2.1 BF.RESERVE:预创建过滤器(推荐)在使用前必须先用此命令预创建,否则使用BF.ADD时会使用模块默认参数,可能导致内存浪费或精度不足。bashBF.RESERVE {key} {error_rate} {capacity} [EXPANSION expansion] [NONSCALING]参数详解:参数含义示例说明error_rate期望误判率(0-1)0.001(0.1%)越小越精确,但内存占用越大capacity预期存储元素数量1000000预估容量,过小会影响性能EXPANSION扩容因子2达到容量后,新子过滤器大小 = 当前大小 × expansionNONSCALING禁止扩容-达到容量后直接报错,不创建子过滤器容量与内存的关系:误判率哈希函数数量每元素所需位数100万元素所需内存1%79.585 位≈ 11.4 MB0.1%1014.378 位≈ 17.1 MB0.01%1419.170 位≈ 22.9 MB计算公式:总位数 = capacity × (-ln(error_rate) / (ln(2)^2))bash# 创建:预计100万元素,误判率0.1%,扩容因子2 127.0.0.1:6379 BF.RESERVE my_filter 0.001 1000000 EXPANSION 2 OK # 如果再次执行相同命令会报错 127.0.0.1:6379 BF.RESERVE my_filter 0.001 1000000 (error) ERR item exists2.2 基础操作命令bash# 添加单个元素 BF.ADD my_filter "user:123" # 返回: (integer) 1 # 检查元素是否存在 BF.EXISTS my_filter "user:123" # 返回: (integer) 1(可能存在) BF.EXISTS my_filter "user:999" # 返回: (integer) 0(一定不存在) # 批量添加 BF.MADD my_filter "user:456" "user:789" "user:abc" # 返回: 1) (integer) 1 2) (integer) 1 3) (integer) 1 # 批量检查 BF.MEXISTS my_filter "user:456" "user:999" "user:123" # 返回: 1) (integer) 1 2) (integer) 0 3) (integer) 12.3 BF.INSERT:创建即插入

相关文章:

Redis 布隆过滤器使用深入分析

Redis 布隆过滤器使用深入分析 布隆过滤器是一种概率型数据结构,它用极小的内存空间换取了“告诉你某个元素一定不存在或可能存在”的能力。在 Redis 生态中,布隆过滤器通过 RedisBloom 模块实现,已成为解决缓存穿透、海量数据去重等问题的标准方案。 一、核心原理:为什么…...

Linux下用dlopen加载动态库,遇到undefined symbol别慌!三种解法实测(附GCC命令)

Linux动态库加载实战:破解undefined symbol的三大黄金法则 深夜的终端前,你刚完成一个模块的动态库编译,却在dlopen加载时遭遇了刺眼的undefined symbol错误。作为Linux/C开发者,这种场景几乎成为成长路上的必经之痛。本文将带你直…...

智能迭代器员中的元素遍历与访问控制

智能迭代器在现代编程中扮演着至关重要的角色,它不仅简化了数据结构的遍历过程,还通过灵活的访问控制机制提升了代码的安全性与效率。无论是处理大规模数据集,还是实现复杂算法,智能迭代器都能以优雅的方式完成任务。本文将深入探…...

5步掌握RuoYi-Flowable-Plus:企业级工作流系统搭建实战指南

5步掌握RuoYi-Flowable-Plus:企业级工作流系统搭建实战指南 【免费下载链接】RuoYi-Flowable-Plus 本项目基于 RuoYi-Vue-Plus 进行二次开发扩展Flowable工作流功能,支持在线表单设计和丰富的工作流程设计能力。如果觉得这个项目不错,麻烦点个…...

全文降AI的好处:从知网检测算法角度解读为什么要全文处理

全文降AI的好处:从知网检测算法角度解读为什么要全文处理 2026年的毕业季,知网AIGC检测已经成了大多数高校的标配。很多同学论文写完之后第一件事不是找导师看,而是先查一下AI率。 问题来了:查完之后发现AI率偏高,应该…...

软件测试如何转型产品经理?成功案例全解析

在人工智能与数字化转型加速的时代,软件测试从业者正迎来职业跃升的黄金窗口。测试工程师凭借对系统全生命周期的深度理解、风险管控基因和用户同理心,天然具备转型产品经理的核心优势。本文从专业视角解析转型路径、必备技能、实战案例及避坑指南&#…...

Ostrakon-VL 终端 Codex 辅助编程:使用 AI 生成模型调用与数据处理代码

Ostrakon-VL 终端 Codex 辅助编程:使用 AI 生成模型调用与数据处理代码 1. 场景引入:当AI遇上终端开发 想象一下这样的场景:你正在开发一个基于Ostrakon-VL模型的终端应用,需要处理大量图像数据。每次都要手动编写重复的预处理代…...

从Word2Vec到BERT:聊聊Embedding技术这十年,我们踩过的“坑”和收获的“宝”

从Word2Vec到BERT:Embedding技术的十年进化与实战启示 十年前,当Word2Vec首次将词语映射为稠密向量时,很少有人能预料到这项技术会彻底改变我们处理自然语言的方式。如今,从搜索引擎的语义理解到推荐系统的个性化匹配,…...

Stable-Diffusion-v1-5-Archive 模型部署运维指南:监控、日志与故障排查

Stable-Diffusion-v1-5-Archive 模型部署运维指南:监控、日志与故障排查 部署好一个AI模型,就像把一台新机器开动起来,真正的挑战往往在后面。模型跑起来了,但它稳定吗?效率怎么样?出了问题怎么快速找到原…...

EMC Partner ESD3000 手持静电放电发生器 30kV

ESD3000是*符合所有标准的静电放电抗扰度测试仪,选购不同放电模组,可进行电信、汽车、航空、元器件等各类产品标准的静电放电抗扰度测试。 产品特性: ● 高放电电压空气放电和接触放电都可高达30kV。 ● 内置9组设置存储功能,另内…...

终极RPG Maker解密工具:跨平台提取加密游戏资源完整指南

终极RPG Maker解密工具:跨平台提取加密游戏资源完整指南 【免费下载链接】RPGMakerDecrypter Tool for decrypting and extracting RPG Maker XP, VX and VX Ace encrypted archives and MV and MZ encrypted files. 项目地址: https://gitcode.com/gh_mirrors/rp…...

WPF中RelativeSource在CommandParameter绑定中的高级应用技巧

1. RelativeSource基础:为什么它是WPF绑定的瑞士军刀 第一次看到RelativeSource这个语法时,我正试图在一个DataGrid里实现点击按钮获取当前行数据的场景。当时试了各种Binding Path写法都失败,直到发现RelativeSource这个神器。简单来说&…...

Phi-3 Forest Lab实战案例:用‘正在聆听风的声音’加载状态提升用户等待体验

Phi-3 Forest Lab实战案例:用正在聆听风的声音加载状态提升用户等待体验 1. 项目背景与设计理念 在当今AI应用爆炸式增长的时代,用户体验往往被技术性能指标所掩盖。Phi-3 Forest Lab通过独特的"自然治愈系"设计语言,重新思考了人…...

文件系统设计避坑指南:为什么你的链接分配方案总遇到性能瓶颈?

文件系统设计避坑指南:为什么你的链接分配方案总遇到性能瓶颈? 在资源受限的嵌入式系统或高并发分布式存储场景中,文件系统的性能瓶颈往往源于数据块分配策略的选择失误。一位资深工程师可能花费数周优化读写算法,却忽略了底层分配…...

Ubuntu22.04新系统下MVS V3.0.1驱动海康威视工业相机实战

1. 环境准备与系统迁移背景 最近把开发环境从Ubuntu16.04升级到了22.04,主要原因是新项目需要使用ROS2 Humble。说实话,系统迁移这事儿看着简单,实际操作起来还是有不少坑要踩的。特别是像我们这种用海康威视工业相机的,驱动兼容性…...

TEKLauncher:如何用3个步骤彻底解决方舟游戏管理与MOD冲突问题?

TEKLauncher:如何用3个步骤彻底解决方舟游戏管理与MOD冲突问题? 【免费下载链接】TEKLauncher Launcher for ARK: Survival Evolved 项目地址: https://gitcode.com/gh_mirrors/te/TEKLauncher 你是否曾因为《方舟:生存进化》的MOD冲突…...

Modern.js 3.0 正式发布:更聚焦的 Web 框架,全面拥抱 Rspack 与 RSC

三年磨一剑,从完整的工程体系到专注 Web 框架,Modern.js 3.0 带来了 React Server Component、Rspack 深度集成、全链路插件化等重磅特性。本文不仅解读这些技术升级,还将从测试开发视角探讨 AI 项目中的工程实践。前言距离 Modern.js 2.0 发…...

告别理论仿真!手把手教你用LabVIEW+USRP玩转BPSK/QPSK调制与(7,4)线性分组码

从零构建无线通信系统:LabVIEW与USRP实战指南 通信理论课本上的公式总是让人望而生畏,直到你将BPSK信号通过USRP发射出去,在频谱仪上看到清晰的星座图——那一刻,所有的数学符号突然变得鲜活起来。本文将带你跨越理论与实践的鸿沟…...

Spot SDK核心概念解析:理解机器人编程的关键要素

Spot SDK核心概念解析:理解机器人编程的关键要素 【免费下载链接】spot-sdk Spot SDK repo 项目地址: https://gitcode.com/gh_mirrors/sp/spot-sdk Spot SDK是波士顿动力公司为其四足机器人Spot开发的软件开发工具包,它提供了丰富的API和工具&a…...

小马智行世界模型进化史,PonyWorld方案解析......

点击下方卡片,关注“自动驾驶之心”公众号戳我-> 领取自动驾驶近30个方向学习路线编辑 | 自动驾驶之心>>自动驾驶前沿信息获取→自动驾驶之心知识星球自从18年世界模型开始进入大众视野以来,已经逐渐烟花成“学习环境规律 — 推演未来 — 再优化…...

别再被时序约束吓到了!用Vivado/Quartus给FPGA新手的第一份“安全驾驶指南”

FPGA时序约束新手指南:从畏惧到驾驭的实战手册 第一次在示波器上看到那些不规则的毛刺时,我的手心冒出了冷汗。那是我用FPGA驱动高速ADC的第三个不眠之夜,明明仿真完美的设计,在实际硬件上却产生了随机错误。我的导师走过来看了一…...

10个免费Illustrator脚本:彻底改变你的设计工作流

10个免费Illustrator脚本:彻底改变你的设计工作流 【免费下载链接】illustrator-scripts Adobe Illustrator scripts 项目地址: https://gitcode.com/gh_mirrors/il/illustrator-scripts 你是否厌倦了在Adobe Illustrator中重复执行枯燥的操作?是…...

STM32 HardFault调试实战:用Keil的Call Stack快速定位崩溃代码

STM32 HardFault调试实战:用Keil的Call Stack快速定位崩溃代码 嵌入式开发中,HardFault异常就像一位不速之客,总是在最不合时宜的时刻出现。当你的STM32程序突然"跑飞",最终停在HardFault_Handler的死循环中时&#xff…...

8大漫画网站一站式下载:comics-downloader跨平台自动化解决方案

8大漫画网站一站式下载:comics-downloader跨平台自动化解决方案 【免费下载链接】comics-downloader tool to download comics and manga in pdf/epub/cbr/cbz from a website 项目地址: https://gitcode.com/gh_mirrors/co/comics-downloader comics-downlo…...

Cursor Pro破解工具:从设备限制到永久免费使用的完整指南

Cursor Pro破解工具:从设备限制到永久免费使用的完整指南 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your …...

CefFlashBrowser:在Flash技术消亡时代重新激活数字遗产的专业解决方案

CefFlashBrowser:在Flash技术消亡时代重新激活数字遗产的专业解决方案 【免费下载链接】CefFlashBrowser Flash浏览器 / Flash Browser 项目地址: https://gitcode.com/gh_mirrors/ce/CefFlashBrowser 当主流浏览器纷纷弃用Flash支持,数以百万计的…...

GitHub下载的PyTorch包怎么手动安装?以thop为例,解决pip install失败问题

GitHub下载的PyTorch包手动安装全指南:以thop为例解决pip安装失败 遇到PyTorch生态工具包安装失败时,手动从GitHub源码安装往往是最高效的解决方案。本文将手把手带你完成从源码下载到环境配置的全流程,特别针对thop这类PyTorch扩展包的典型安…...

GLM-OCR开源OCR部署:2.5GB模型在消费级RTX 4090上流畅运行实录

GLM-OCR开源OCR部署:2.5GB模型在消费级RTX 4090上流畅运行实录 1. 项目概述与核心价值 GLM-OCR是一个基于GLM-V编码器-解码器架构构建的多模态OCR模型,专门为复杂文档理解而设计。这个2.5GB的模型在消费级RTX 4090显卡上能够流畅运行,为个人…...

Spring Cloud Alibaba下的单点登录实践:若依微服务集成CAS避坑指南

Spring Cloud Alibaba微服务架构下的单点登录深度实践 在分布式系统架构中,身份认证一直是开发者面临的核心挑战之一。当企业采用微服务架构后,传统的单体应用认证方案往往难以满足多服务间的统一认证需求。本文将深入探讨基于Spring Cloud Alibaba生态体…...

考研数学二核心公式速查手册(基础篇)

1. 几何公式速查与实战应用 考研数学二中几何公式是基础中的基础,但很多同学容易混淆不同图形的计算公式。记得去年辅导的一个考生,就因为把圆锥侧面积和体积公式记反,导致大题整整丢了12分。下面我们把这些关键公式拆解清楚: 体积…...