Redis 源码分析-内部数据结构 robj
Redis 源码分析-内部数据结构 robj
Redis 中,一个 database 内的这个映射关系是用一个 dict 来维护的(ht[0])。dict 的 key 固定用一种数据结构来表达就够了,即动态字符串 sds。而 value 则比较复杂,为了在同一个 dict 内能够存储不同类型的 value,这就需要一个通用的数据结构,这个通用的数据结构就是robj(全名 redisObject )。
#define LRU_BITS 24// redis 键值对中的 value 结构体,头占 16 字节,ptr 指针指向真正的数据
typedef struct redisObject {unsigned type: 4; // 4 bit 数据类型 string、list、setunsigned encoding: 4; // 4 bit 编码方式 embStr、raw、ziplistunsigned lru: LRU_BITS; // 24 bit LRU 时间/* LRU time (relative to global lru_clock) or* LFU data (least significant 8 bits frequency* and most significant 16 bits access time). */int refcount; // 4 字节 引用次数,主要针对共享对象void *ptr; // 8 字节 指向具体实现的指针
} robj;
首先解释下这5个字段的含义:
- type 数据类型,string、list、hash…
/* The actual Redis Object */
#define OBJ_STRING 0 /* String object. */
#define OBJ_LIST 1 /* List object. */
#define OBJ_SET 2 /* Set object. */
#define OBJ_ZSET 3 /* Sorted set object. */
#define OBJ_HASH 4 /* Hash object. */#define OBJ_MODULE 5 /* Module object. */
#define OBJ_STREAM 6 /* Stream object. */
- encoding 编码方式,比如 string 就有 embstr 和 raw 编码方式
#define OBJ_ENCODING_RAW 0 /* Raw representation */
#define OBJ_ENCODING_INT 1 /* Encoded as integer */
#define OBJ_ENCODING_HT 2 /* Encoded as hash table */
#define OBJ_ENCODING_ZIPMAP 3 /* Encoded as zipmap */
#define OBJ_ENCODING_LINKEDLIST 4 /* No longer used: old list encoding. */
#define OBJ_ENCODING_ZIPLIST 5 /* Encoded as ziplist */
#define OBJ_ENCODING_INTSET 6 /* Encoded as intset */
#define OBJ_ENCODING_SKIPLIST 7 /* Encoded as skiplist */
#define OBJ_ENCODING_EMBSTR 8 /* Embedded sds string encoding */
#define OBJ_ENCODING_QUICKLIST 9 /* Encoded as linked list of ziplists */
#define OBJ_ENCODING_STREAM 10 /* Encoded as a radix tree of listpacks */
- lru LRU(Least Recently Used)时间,在 redis 淘汰数据时会用
- refcount 引用计数。它允许 robj 对象在某些情况下被共享,例如 redis 在启动时对于常见的响应指令(ok、error),错误信息,0-9999 的数字对象都进行了创建并复用
- ptr 指针 指向真正的值
接着分析下这个结构体的定义方式
unsigned type: 4
这是 C 语言里的位域定义方法,表示该字段所占的比特数(bit)
最后我们分析可以知道,一个这样的 redisObject 需要占用 4bit + 4bit + 24bit + 4B +8B 即 16 字节空间,注意这个 16 字节
这对我们 redis 的调优有没有什么启发呢?
- 如果我要存一个很短的字符串, 字符串可能不到16字节,但为了描述这个字符串的头结构就占了16字节,内存利用率是不是低了?
- 如果我要存一个数字,8字节就能搞定,还有必要让 ptr 指针去指向一个真实存储这个数字的空间吗?
另外,目前的机器基本都是 64 位架构,通常处理器的缓存行大小是 64 字节(64B),这意味着每次从内存加载数据到缓存时,最小的单位是 64 字节。即使你只需要其中的一部分数据,剩余的部分也会被一并加载到缓存中。redis 中的创建的很多字符串,都会采用 SDS8 的结构(SDS5 无法记录有效容量,对后续拓展不友好),如果 SDS8 点字符串 + redisObject 的头大小,恰好能满足 64B,意味着就不用再去内存中取数据了。
这就是 Redis String 类型 embStr 编码方式:
// <= 44 字节就使用 embStr 的 encoding 类型,否则使用 raw 编码类型
#define OBJ_ENCODING_EMBSTR_SIZE_LIMIT 44// 创建字符串对象的函数
robj *createStringObject(const char *ptr, size_t len) {// 字符串少于44字节,就 embStr 类型编码,否则 raw 类型编码if (len <= OBJ_ENCODING_EMBSTR_SIZE_LIMIT)return createEmbeddedStringObject(ptr, len);elsereturn createRawStringObject(ptr, len);
}
struct __attribute__ ((__packed__)) sdshdr8 {uint8_t len; // 现有长度 1 字节uint8_t alloc; // 字符数组的空间长度(不包括结构体头和字符数组最后'\0'的一字节) 1 字节unsigned char flags; // 标识位 3 bit 用来标识类型,5 bit 暂时无用 1 字节char buf[]; // 真正存放字符串的数组,以 '\0' 结尾,注意其没有指明长度,这是一种特殊写法,柔性数组,初始化分配时不占用内存空间
};
我们来分析一下为什么是 44 字节
redisObject 16 字节
sdshdr8 3 字节
数组最后的’\0’标识 1 字节
64 - 16 - 3 - 1 = 44 字节
指的一提的是,即使刚开始我们创建的是一个 embStr 编码的字符串,只要对其进行 append 操作,编码方式就会变为 raw,原因是变动会执行下面这个函数:
void appendCommand(client *c) {size_t totlen;robj *o, *append;o = lookupKeyWrite(c->db, c->argv[1]);if (o == NULL) {/* Create the key */c->argv[2] = tryObjectEncoding(c->argv[2]);dbAdd(c->db, c->argv[1], c->argv[2]);incrRefCount(c->argv[2]);totlen = stringObjectLen(c->argv[2]);} else {/* Key exists, check type */if (checkType(c, o, OBJ_STRING))return;/* "append" is an argument, so always an sds */append = c->argv[2];totlen = stringObjectLen(o) + sdslen(append->ptr);if (checkStringLength(c, totlen) != C_OK)return;/* Append the value */// 这里在追加值的时候 会把新生成的 str 转为 raw 编码o = dbUnshareStringValue(c->db, c->argv[1], o);o->ptr = sdscatlen(o->ptr, append->ptr, sdslen(append->ptr));totlen = sdslen(o->ptr);}signalModifiedKey(c->db, c->argv[1]);notifyKeyspaceEvent(NOTIFY_STRING, "append", c->argv[1], c->db->id);server.dirty++;addReplyLongLong(c, totlen);
}robj *dbUnshareStringValue(redisDb *db, robj *key, robj *o) {serverAssert(o->type == OBJ_STRING);// 引用计数不为1 或 之前不是 raw 编码if (o->refcount != 1 || o->encoding != OBJ_ENCODING_RAW) {robj *decoded = getDecodedObject(o);// 创建 raw 编码的对象o = createRawStringObject(decoded->ptr, sdslen(decoded->ptr));decrRefCount(decoded);dbOverwrite(db, key, o);}return o;
}
可以通过以下命令来验证
127.0.0.1:6379> set test aaa
OK
127.0.0.1:6379> object encoding test
"embstr"
127.0.0.1:6379> append test b
(integer) 4
127.0.0.1:6379> object encoding test
"raw"
相关文章:
Redis 源码分析-内部数据结构 robj
Redis 源码分析-内部数据结构 robj Redis 中,一个 database 内的这个映射关系是用一个 dict 来维护的(ht[0])。dict 的 key 固定用一种数据结构来表达就够了,即动态字符串 sds。而 value 则比较复杂,为了在同一个 dic…...
多通道数据采集和信号生成的模块化仪器如何重构飞机电子可靠性测试体系?
飞机的核心电子系统包括发电与配电系统,飞机内部所有设备和系统之间的内部数据通信系统,以及用于外部通信的射频设备。其他所有航空电子元件都依赖这些关键总线进行电力传输或数据通信。在本文中,我们将了解模块化仪器(无论是PCIe…...
面试(进阶) —虚拟列表在什么场景使用,如何实现?
面试(进阶) —虚拟列表在什么场景使用,如何实现? 在前端开发中,当需要渲染大量数据时,传统的渲染方式往往会遇到性能瓶颈。一次性将大量数据渲染到DOM中,不仅会导致页面加载缓慢,还可能占用大量内存&#x…...
Python—Excel全字段转json文件(极速版+GUI界面打包)
目录 专栏导读1、背景介绍2、库的安装3、核心代码4、完整代码(简易版)5、进阶版(GUI)总结专栏导读 🌸 欢迎来到Python办公自动化专栏—Python处理办公问题,解放您的双手 🏳️🌈 博客主页:请点击——> 一晌小贪欢的博客主页求关注 👍 该系列文章专栏:请点击——…...
【Linux第一弹】Linux基础指令(上)
目录 1.ls指令 1.1 ls使用实例 2.pwd指令 3.cd指令 3.1 cd使用实例 4.touch指令 4.1touch使用实例 5.mkdir指令 5.1mkdir使用实例 6.rmdir指令和rm指令 6.1 rmdir指令使用实例->: 6.2 rm指令使用实例 7.man指令 8.cp指令 8.1 cp 使用实例 9.mv指令 9.1mv使用…...
DeepSeek教unity------UI元素长按响应
主要功能说明: 长按检测:通过记录指针按下的时间,判断是否达到 longClickTime,从而触发长按事件。状态管理:使用 StateEnum 枚举管理点击项的当前状态(未按下、按下等待长按、长按已触发)。…...
Netty为什么性能很高?
大家好,我是锋哥。今天分享关于【Netty为什么性能很高?】面试题。希望对大家有帮助; Netty为什么性能很高? 1000道 互联网大厂Java工程师 精选面试题-Java资源分享网 Netty是一款高性能的网络通信框架,主要用于构建高性能的网络应用程序。…...
[深度学习] 大模型学习2-提示词工程指北
在文章大语言模型基础知识里,提示词工程(Prompt Engineering)作为大语言模型(Large Language Model,LLM)应用构建的一种方式被简要提及,本文将着重对该技术进行介绍。 提示词工程就是在和LLM聊…...
MySQL 和 PostgreSQL 的详细对比
以下是 MySQL 和 PostgreSQL 的详细对比,帮助您根据需求选择合适的数据库: 1. 核心特性对比 特性MySQLPostgreSQL数据库类型关系型数据库 (RDBMS)关系型数据库 (RDBMS),支持部分 NoSQL 特性SQL 标准兼容性部分兼容(简化语法&…...
基于POI的Excel下拉框自动搜索,包括数据验证的单列删除
目录 目标 例子 1.搜索下拉框页 2.数据源页 3.效果 代码以及注意事项 1.代码 2.注意事项 1.基于Excel的话,相当于加入了一个【数据验证】 2.代码中的一些方法说明 目标 期望在Excel利用代码创建具备自动搜索功能的下拉框 例子 1.搜索下拉框页 2.数据源…...
Android中使用Robolectric测试点击事件(不需要手机)
文章目录 一、前言二、简单示例三、参考文档 一、前言 Robolectric 是一个由 Google 维护的开源 Android 测试框架,它允许你以 Android 运行时环境运行单元测试。 Robolectric 提供了一个模拟 Android 运行时环境,允许你测试你的代码是否正确地使用 And…...
C++Primer学习(4.7 条件运算符)
4.7 条件运算符 条件运算符( ? :)允许我们把简单的if-else逻辑嵌入到单个表达式当中,条件运算符按照如下形式使用: cond ? exprl : expr2; 其中cond是判断条件的表达式,而expr1和expr2是两个类型相同或可能转换为某个公共类型的表达式。条件运算符的执…...
Python 数据可视化(一)熟悉Matplotlib
目录 一、安装包 二、先画个折线图 1、修改标签文字和线条粗细 2、内置样式 3、scatter() 绘制散点图 4、scatter() 绘制多个点 5、设置样式 6、保存绘图 数据可视化指的是通过可视化表示来探索和呈现数据集内的规律。 一、安装包 win R 打开终端 安装 Matplotlib&…...
c#实现485协议
在C#中实现RS-485协议通信,需要结合串口(SerialPort)操作和硬件收发控制(如RTS信号切换)。以下是详细的步骤和示例代码: 1. RS-485通信原理 物理层:RS-485是差分信号标准,支持多点通信(半双工)。 收发控制:通过控制RTS(Request to Send)或DTR引脚切换发送/接收模式…...
考研出分24小时,人类精神状态图鉴
2月24日,上午10点起,各省考研初试成绩陆续公布,考生们或紧张的输入准考证号,或抱团等待“审判”。然而更魔幻的还在后头——下午4点,教育部竟在同一天直接发布了《2025年研考国家分数线》。 不少网友表示:…...
神经网络AI原理回顾
长期记忆存储在大模型的参数权重中,不经过推理和编码无法读取,且必须依赖输入的提示,因为大模型不会无缘无故的自言自语,毕竟输入层是它唯一 与外界交互的窗口。 目前个性化大模型的局限就是训练成本过高,除非使用RAG&…...
不同数据类型在数据库和编程语言之间的对应关系表
不同数据类型在数据库和编程语言之间的对应关系表 MySql 与 C# MySqlC#varcharstringbigintlongbigint unsignedulongintintint unsigneduintsmallintshortsmallint unsignedushortVARCHAR(36)GuidsmalldatetimeDateTimedateDateTimedatetimeDateTimetimestampDateTimefloatf…...
数据库导出
MySQL数据库 使用命令行导出 导出整个数据库:在命令行中输入mysqldump -u用户名 -p密码 数据库名 > 导出文件路径/文件名.sql。例如mysqldump -uroot -p123456 mydb > /home/user/mydb_backup.sql,回车后输入密码即可将名为mydb的数据库导出为SQL…...
进程间通信 —— 共享内存
目录 1.共享内存实现通信的原理 2.如何使用共享内存实现通信 共享内存通信接口介绍 shmget shmat shmdt shmctl 使用示例 key和shmid 3.共享内存通信的优缺点 缺点:不提供任何同步机制,可能会造成数据混乱。 优点:共享内存是进程…...
本地搭建dify结合ollama+deepseek方法详解
1.安装ollama,安装deepseek-r1:8b模型 2.安装dify社区版 访问Dify GitHub项目地址 git clone https://github.com/langgenius/dify.git cd dify/docker cp .env.example .env docker compose up -d docker compose ps 查重以下实例是否启动成功: 更新Dif…...
冒泡排序算法优化
一 概述 冒泡排序是一种简单的交换排序算法,其核心思想是通过相邻元素比较和交换将最大元素逐步移动到数组末尾。 二、基础冒泡排序 void bubbleSort(int arr[], int n) { for (int i = 0; i < n-1; i++) { for (int j = 0; j < n-i-1; j++) { if…...
Linux系统软件管理
systemctl 控制软件启动和关闭 Linux系统很多软件支持使用systemctl命令控制:启动,停止,开启自启。 能被systemctl管理的软件,一般被称为:服务。 语法:systemctl start|stop|status|enable|disable 服务名…...
C# 使用 Newtonsoft.Json 序列化和反序列化对象实例
Newtonsoft.Json(也被称为 Json.NET)是一个广泛使用的用于在 C# 中进行 JSON 序列化和反序列化的开源库。下面将详细介绍如何使用它来序列化和反序列化对象。 1. 安装 Newtonsoft.Json 如果你使用的是 Visual Studio,可以通过 NuGet 包管理…...
在Linux桌面上创建Idea启动快捷方式
1、在桌面新建idea.desktop vim idea.desktop [Desktop Entry] EncodingUTF-8 NameIntelliJ IDEA CommentIntelliJ IDEA Exec/home/software/idea-2021/bin/idea.sh Icon/home/software/idea-2021/bin/idea.svg Terminalfalse TypeApplication CategoriesApplication;Developm…...
从0开始的操作系统手搓教程19:构建我们的内存管理——第二步:内存子系统进化,获取页!
目录 讨论页表的分析和索引的完成 完成一个宽泛的页获取 从指定的内存池中分配若干页 获取准备用来提供给客户端方向的虚拟地址起始位置 根据内存池的选择,完成对物理内存的获取 关联我们的物理内存和虚拟内存 编写尝试 运行的截图 现在,我们将会…...
数学软件Matlab下载|支持Win+Mac网盘资源分享
如大家所了解的,Matlab与Maple、Mathematica并称为三大数学软件。Matlab应用广泛,常被用于数据分析、无线通信、深度学习、图像处理与计算机视觉、信号处理、量化金融与风险管理、机器人,控制系统等领域。 Matlab将数值分析、矩阵计算、科学…...
Basler acA1920-40gc
软件 下载Basler软件 | Basler AG 说明书 ace acA1920-40gc | GigE相机 | Basler | Basler AG 支持PTP同步 在使用 Basler acA1920-40gc 相机和 Polyn View 软件时,确认 PTP(Precision Time Protocol)同步是否成功,可以通过…...
FASIONAD:自适应反馈的类人自动驾驶中快速和慢速思维融合系统
24年11月来自清华、早稻田大学、明尼苏达大学、多伦多大学、厦门大学马来西亚分校、电子科大(成都)、智平方科技和河南润泰数字科技的论文“FASIONAD : FAst and Slow FusION Thinking Systems for Human-Like Autonomous Driving with Adaptive Feedbac…...
sql server 复制从备份初始化数据
参考 : 从备份初始化订阅(事务) - SQL Server | Microsoft Learn sql server 复制默认是用快照初始化数据的,也支持从备份初始化数据,参考如上...
java八股文之框架
1.Spring框架中的Bean是否线程安全的 Spring框架中的Bean默认是单例的,不是线程安全的。因为一般在Spring的bean的中都是注入无状态的对象,没有线程安全问题,如果在bean中定义了可修改的成员变量,是要考虑线程安全问题的…...
