Redis BigKey案例
面试题:
- 阿里广告平台,海量数据里查询某一固定前缀的key
- 小红书,你如何生产上限制keys*/flushdb/flushall等危险命令以防止误删误用?
- 美团,MEMORY USAGE命令你用过吗?
- BigKey问题,多大算big?你如何发现?如何删除?如何处理?
- BigKey你做过调优吗?惰性释放lazyfree了解过吗?
- Morekey问题,生产上redis数据库有1000W记录,你如何遍历?key*可以吗?
- ......
MoreKey案例(很多key)
大批量往redis里面插入2000W测试数据key
1、Linux Bash下面执行,插入100WB

理解:生成100W条redis批量设置kv的语句(key=kn,value=vn)写入到/tmp目录下的redisTest.txt文件中。
for((i=1;i<=100*10000;i++)); do echo "set k$i v$i" >> /tmp/redisTest.txt ;done;
2、通过redis提供的管道 -> pipe命令插入100W大批量数据
cat /tmp/redisTest.txt | /opt/redis-7.0.0/src/redis-cli -h 127.0.0.1 -p 6379 -a 111111 --pipe

某快递巨头真实生产案例新闻
尝试:keys * 试试100W花费多少秒遍历查询
结果:key * 这个指令有致命的弊端,在实际环境中最好不要使用
这个指令没有offset、limit参数,是要一次性吐出所有满足条件的key,由于redis是单线程的,其所有操作都是原子的,而keys算法是遍历算法,复杂度是O(n),如果实例中有千万级以上的key,这个指令就会导致Redis服务卡顿,所有读写Redis的其它的指令都会被延后甚至会超时报错,可能会引起缓存雪崩甚至数据库宕机。
生产上如何限制操作命令
生产上限制keys*/flushdb/flushall等危险命令以防止误删误用?
通过配置禁用这些命令,redis.conf在SECURITY这一项中,其实就是重命名的方式。


不用keys*避免卡顿,那该用什么
答案:使用scan命令。一句话,类似mysql limit。但不完全相同。
官网地址:SCAN | Redis
中文地址:Redis SCAN 命令 递增地遍历key空间

Redis SCAN 命令及其相关命令 SSCAN、HSCAN、 ZSCAN 命令都是用于增量遍历集合中的元素。
- SCAN 用于遍历当前数据库中的键。
- SSCAN 用于遍历集合键中的元素。
- HSCAN 用于遍历哈希键中的键值对。
- ZSCAN 用于遍历有序集合中的元素(包括元素成员和元素分值)。
语法
SCAN cursor [MATCH pattern] [COUNT count]
- cursor - 游标。
- pattern - 匹配的模式。
- count - 指定从数据集里返回多少元素,默认值为 10 。
理解:基于游标的迭代器,需要基于上一次的游标延续之前的迭代过程,以0作为游标开始一次新的迭代,直到命令返回游标0完成一次遍历,不保证每次执行都返回某个给定数量的元素,支持模糊查询,一次返回的数量不可控,只能是大概率符合count参数。
SCAN 命令是一个基于游标的迭代器,每次被调用之后, 都会向用户返回一个新的游标, 用户在下次迭代时需要使用这个新游标作为 SCAN 命令的游标参数, 以此来延续之前的迭代过程。
SCAN 返回一个包含两个元素的数组, 第一个元素是用于进行下一次迭代的新游标, 第二个元素则是一个数组, 这个数组中包含了所有被迭代的元素。如果新游标返回零表示迭代已结束。
SCAN的遍历顺序
非常特别,它不是从第一维数组的第零位一直遍历到末尾,而是采用了高位进位加法来遍历。之所以使用这样特殊的方式进行遍历,是考虑到字典的扩容和缩容时避免槽位的遍历重复和遗漏。
使用

BigKey案例
多大算Big
参考《阿里云Redis?开发规范》

string和二级结构
1、string是value,最大512MB但是≥10KB就是bigkey
2、Iist、hash、set和zset,个数超过5000就是bigkey
- list:一个列表最多可以包含2^32-1个元素(4294967295,每个列表超过40亿个元素)
- hash:Redis中每个hash可以存储2^32-1键值对(40多亿)
- set:集合中最大的成员数为2^32-1(4294967295,每个集合可存储40多亿个成员)
- ...
一般Iist、hash、set这些数据存储不到这么大,规定存到超5000就是大key。
哪些危害
- 内存不均,集群迁移困难
- 超时删除,大key删除作梗
- 网络流量阻塞
如何产生
社交类:王心凌粉丝列表,典型案例粉丝逐步递增
汇总统计:某个报表,月日年经年累月的积累
如何发现
命令:redis-cli --bigkeys
好处:给出每种数据结构Top 1 bigkey,同时给出每种数据类型的键值个数+平均大小。
不足:想查询大于10kb的所有key,--bigkeys参数就无能为力了,需要用到memory usage来计算每个键值的字节数。
示例:
redis-cli -h 127.0.0.1 -p 6379 -a 111111 --bigkeys
redis-cli -h 127.0.0.1 -p 7001 –-bigkeys -i 0.1
每隔 100 条 scan 指令就会休眠 0.1s,ops 就不会剧烈抬升,但是扫描的时间会变长

MEMORY USAGE键
官网:Redis MEMORY USAGE 命令 估计key的内存使用情况
MEMORY USAGE 命令给出一个
key和它的值在 RAM 中所占用的字节数。返回的结果是
key的值以及为管理该key分配的内存总字节数。对于嵌套数据类型,可以使用选项
SAMPLES,其中count表示抽样的元素个数,默认值为 5 。当需要抽样所有元素时,使用SAMPLES 0。
语法:MEMORY USAGE key [SAMPLES count]
如何删除
参考《阿里云Redis开发规范》

String
一般用del,如果过于庞大unlink
hash
使用hscan每次获取少量field-value,再使用hdel删除每个field

阿里手册:

list
使用trim新进式逐步删除,直到全部删除完成

阿里手册:

set
使用sscan每次获取部分元素,再使用srem命令删除每个元素

阿里手册:

zset
使用zscan每次获取部分元素,再使用ZREMRANGEBYRANK命令删除每个元素

阿里手册:

BigKey生产调优
主要是在redis.conf配置文件LAZY FREEING。
阻塞和非阻塞删除命令

优化配置

相关文章:
Redis BigKey案例
面试题: 阿里广告平台,海量数据里查询某一固定前缀的key小红书,你如何生产上限制keys*/flushdb/flushall等危险命令以防止误删误用?美团,MEMORY USAGE命令你用过吗?BigKey问题,多大算big&#…...
ThinkPHP v6.0.8 CacheStore 反序列化漏洞
漏洞说明 1. 漏洞原理:ThinkPHP 6.0.8 CacheStore 会触发POP利用链子,造成任意命令执行 2. 组件描述: ThinkPHP是一个免费开源的,快速、简单的面向对象的轻量级PHP开发框架 3. 影响版本:V6.0.8 漏洞复现 1. 环境安…...
Spring 事务详解(注解方式)
目 录 序言 1、编程式事务 2、配置声明式事务 2.1 基于TransactionProxyFactoryBean的方式(不常用,因为要为每一个类配置TransactionProxyFactoryBean) 2.2 基于AspectJ的XML方式(常用,可配置在某些类下的所有子…...
华为云waf 使用场景
防护Web应用免受攻击就用华为云Web应用防火墙 Web应用防火墙(Web Application Firewall, WAF),通过对HTTP(S)请求进行检测,识别并阻断SQL注入、跨站脚本攻击、网页木马上传、命令/代码注入、文件包含、敏感文件访问、第…...
?.的写法 后缀修饰符
概览:处理后端返回的数据data,写法:data?.name。解决vue框架编译出现的报错Cannot read property name of undefined。出现问题的原因:这是因为我们试图访问对象中不在的 key 为 name 的属性,那么怎么解决呢ÿ…...
org.apache.hadoop.hive.ql.exec.DDLTask. show Locks LockManager not specified解决
Error while processing statement: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. show Locks LockManager not specified解决 当在Hive中执行show locks语句时,出现"LockManager not specified"错误通常是由于…...
Adaptive autosar 都有哪些模块?各有什么功能?
Adaptive autosar是一种用于高性能计算ECU的软件平台,它支持自适应应用程序的开发和运行。它由两部分组成:基础(Foundation)和服务(Service)。基础包括了操作系统接口、执行管理、网络管理、识别访问管理、加密、更新和配置管理等功能。服务包括了通信管理、RESTful、时间…...
C++ 动态内存分配
在C中动态内存的分配技术可以保证程序在允许过程中按照实际需要申请适量的内存,使用结束后还可以释放,这种在程序运行过程中申请和释放的存储单元也称为堆。 申请和释放过程一般称为建立和删除。 在C程序中,建立和删除堆对象使用两个运算符&…...
设计模式——面向对象的7大设计原则
1.单一职责原则 一个类中最好只放一种类型的方法,比如Dao中只有和数据库交互相关的代码。实现高内聚,低耦合。 2.开闭原则 对外拓展开放,对内修改关闭,有新的需求时不要修改已有代码,而是添加新的代码,比…...
智慧防汛,数字科技的力量
随着夏日的脚步临近,台风季节即将降临。对于那些居住在沿海地区的人们来说,台风是一种常见的自然灾害,其带来的风雨可能对生命和财产造成严重威胁。然而,随着数字科技的飞速发展,可视化技术为防汛抗台工作带来了全新的…...
“中国软件杯”飞桨赛道晋级决赛现场名单公布
“中国软件杯”大学生软件设计大赛是由国家工业和信息化部、教育部、江苏省人民政府共同主办,是全国软件行业规格最高、最具影响力的国家级一类赛事,为《全国普通高校竞赛排行榜》榜单内赛事。今年,组委会联合百度飞桨共同设立了“智能系统设…...
JDBC处理批量数据提高效率
文章目录 0 说明1 如何使用jdbc操作数据库1.1 加载数据库驱动1.2 建立数据库连接1.3 创建Statement或者PreparedStatement用来执行SQL1.4 开始执行SQL语句1.5 处理结果集1.6 关闭连接1.7 完整代码 2 批量操作数据库3 如何打印SQL语句4 jdbc常用开源类库 1 JDBC实现往MySQL插入百…...
使用css和js给按钮添加微交互的几种方式
使用css和js给按钮添加微交互的几种方式 在现实世界中,当我们轻弹或按下某些东西时,它们会发出咔嗒声,例如电灯开关。有些东西会亮起或发出蜂鸣声,这些响应都是“微交互”,让我们知道我们何时成功完成了某件事。在本文…...
react面试之context的value变化时,内部所有子组件是否变化
上测试代码 // context const state {a: 1,b: 1, } const context createContext(state);export default context; // A组件 const A () > {const { a } useContext(context);return (<div>{a}</div>) } export default A;// B组件 const B () > {cons…...
使用okHttp不走代理问题
背景 某日使用okhttp设置代理并发送爬虫请求时,发现部分url请求没有走代理直接和目标url建立了连接,伪代码如下。初始化okhttpClient时设置了proxySelecter代理,但是调用okhttpClient.newCall请求时并没用调用proxySelecter.select函数获取代…...
python moviepy 自动化音视频处理实践
MoviePy是一个用于视频编辑的Python库。它提供了一种简单且直观的方式来处理视频文件,包括剪辑、合并、裁剪、添加文本、添加音频等操作。使用MoviePy,你可以通过编写Python代码来创建和编辑视频,而无需使用复杂的视频编辑软件。 MoviePy建立…...
聊聊混合动力汽车和纯电骑车的优势和劣势
混合动力汽车和纯电动骑车是两种不同的交通工具,它们都有各自的优势和劣势。本文将分别探讨混合动力汽车和纯电动骑车的优势和劣势,并为文章提供三个备选的好听的标题。 混合动力汽车是一种结合了内燃机和电动机的汽车,它可以同时利用燃油和电…...
算法训练Day39|62.不同路径 ● 63. 不同路径 II
LeetCode:62.不同路径 62. 不同路径 - 力扣(LeetCode) 1.思路 想象成矩阵填格子,两个关键点,初始化和递推公式。 初始化除点(0,0)第一行第一列均为1,递推公式推导dp[i][j] dp[i …...
react中hooks分享
一. HOOKS是什么 在计算机程序设计中,钩子一词涵盖了一系列技术,这些技术用来通过拦截函数调用、消息或在软件组件之间传递的事件来改变或增加操作系统、应用程序或其他软件组件的行为。处理这些被截获的函数调用、事件或消息的代码称为“hook”。 在r…...
LeetCode1207. 独一无二的出现次数
题干 给你一个整数数组 arr,请你帮忙统计数组中每个数的出现次数。 如果每个数的出现次数都是独一无二的,就返回 true;否则返回 false。 示例1: 输入:arr [1,2,2,1,1,3] 输出:true 解释:在该…...
Windows Defender Remover:彻底解决Windows安全组件冲突与性能瓶颈的终极方案
Windows Defender Remover:彻底解决Windows安全组件冲突与性能瓶颈的终极方案 【免费下载链接】windows-defender-remover A tool which is uses to remove Windows Defender in Windows 8.x, Windows 10 (every version) and Windows 11. 项目地址: https://gitc…...
紧急预警:C++27 std::filesystem::copy_options::recursive_nowait 已被证实引发静默截断!附官方补丁+3行兼容封装方案(2025 Q2前必读)
第一章:C27 文件系统库扩展应用C27 标准对 <filesystem> 库进行了实质性增强,新增了异步路径遍历、符号链接元数据深度解析、跨设备硬链接原子创建以及基于策略的路径规范化接口。这些特性显著提升了在复杂存储拓扑(如容器挂载点、分布…...
从单机到集群:手把手教你用ES 7.10.0自带JDK搭建多节点测试环境
从单机到集群:手把手教你用ES 7.10.0自带JDK搭建多节点测试环境 在当今数据驱动的时代,Elasticsearch(ES)作为一款开源的分布式搜索和分析引擎,已经成为许多企业和开发者处理海量数据的首选工具。对于开发者和测试人员…...
Qwen3.5-9B Visio图表智能生成:根据文本描述自动创建流程图与架构图
Qwen3.5-9B Visio图表智能生成:根据文本描述自动创建流程图与架构图 1. 引言:告别手动绘图的烦恼 你有没有遇到过这样的情况?开会讨论完一个业务流程,需要把它画成流程图;或者设计了一个系统架构,得在Vis…...
GHelper:重新定义华硕设备的硬件控制体验
GHelper:重新定义华硕设备的硬件控制体验 【免费下载链接】g-helper Lightweight, open-source control tool for ASUS laptops and ROG Ally. Manage performance modes, fans, GPU, battery, and RGB lighting across Zephyrus, Flow, TUF, Strix, Scar, and othe…...
如何通过CPUDoc智能调度技术提升CPU性能与能效比
如何通过CPUDoc智能调度技术提升CPU性能与能效比 【免费下载链接】CPUDoc 项目地址: https://gitcode.com/gh_mirrors/cp/CPUDoc 你是否曾因电脑运行卡顿、游戏帧率不稳或多任务处理缓慢而烦恼?现代CPU虽然拥有强大算力,但Windows系统的默认调度…...
【LLMs篇】Qwen模型家族:从架构设计到多模态应用的全面解析
1. Qwen模型家族的技术架构演进 第一次接触Qwen模型时,最让我惊讶的是它在保持Transformer基础架构的同时,通过一系列精妙改进实现了性能突破。作为阿里云推出的开源大模型家族,Qwen从7B到72B参数规模的版本都采用了类似的架构设计理念&#…...
快速构建SpringBoot微服务:Phi-3-mini智能代码生成与架构咨询
快速构建SpringBoot微服务:Phi-3-mini智能代码生成与架构咨询 1. 引言:当AI助手遇上Java开发 最近接手了一个新项目,需要快速搭建一套SpringBoot微服务架构。正当我对着空白的IDE发愁时,同事推荐了Phi-3-mini这个AI助手。说实话…...
YOLOv8实战:用Ultralytics最新版快速实现口罩检测(附数据集+完整训练代码)
YOLOv8实战:从零构建口罩检测系统的高效指南 在公共卫生事件频发的当下,智能口罩检测系统已成为商场、医院、交通枢纽等公共场所的刚需。Ultralytics推出的YOLOv8作为当前最先进的实时目标检测框架,其开箱即用的特性让开发者能够快速部署高精…...
别再手动导入了!用Pinia + bpmn-js 实现Flowable流程设计的草稿自动恢复与状态管理
基于Pinia与bpmn-js的流程设计器草稿自动恢复方案 在流程设计器的开发过程中,用户最担心的莫过于编辑到一半的流程图因页面刷新或意外关闭而丢失。这种体验问题会直接影响产品的专业性和用户信任度。本文将详细介绍如何利用Vue3生态中的Pinia状态管理库,…...



