当前位置：首页 > news >正文

大白话解析LevelDB：ShardedLRUCache

news 2026/2/9 11:27:32

文章目录

- Cache 接口定义
- ShardedLRUCache 的实现
- - ShardedLRUCache 的构造函数
  - ShardedLRUCache::Insert(const Slice& key, void* value, size_t charge, void (\*deleter)(const Slice& key, void* value))
  - ShardedLRUCache::Lookup(const Slice& key)
  - ShardedLRUCache::Release(Handle* handle)
  - ShardLRUCache::Erase(const Slice& key)
  - ShardedLRUCache::Value(Handle* handle)
  - ShardedLRUCache::NewId()
  - ShardedLRUCache::Prune()
  - ShardedLRUCache::TotalCharge()
- 总结

ShardedLRUCache是Cache的一种实现，所以在看ShardedLRUCache的实现之前，我们需要先了解下Cache的定义。

Cache 接口定义

我们可以先看下Cache的使用姿势，再来看Cache的接口定义。

Cache* cache = NewLRUCache(100);
Handle* handle = cache->Insert("key", "value", 5, nullptr);
cache->Erase("key"); // 即使这里将缓存项从 Cache 中移除了，但该缓存项还是会保留在内存中
cache->Value(handle); // 此时还是可以通过 handle 获取到缓存项的 Value
cache->Release(handle); // 这里将缓存项的引用计数减一，如果引用计数为 0，那么该缓存项会被销毁。

Cache的接口定义如下：

class LEVELDB_EXPORT Cache {public:Cache() = default;Cache(const Cache&) = delete;Cache& operator=(const Cache&) = delete;// 用户调用 Insert() 方法插入一个缓存项时，会同时传入一个 deleter。// 当 Cache 析构时，会调用所有缓存项的 deleter 来对 Cache 里的// 所有缓存项进行清理。virtual ~Cache();// 声明了一个抽象的 Handle 类型，用于表示 Cache 中的一个缓存项。struct Handle {};// 这个方法用于向 Cache 中插入一对 Key-Value，Cache 的实现类会在内部// 基于这对 Key-Value 生成一个 Handle 对象，将该 Handle 插入到 Cache// 中，并把这个 Handle 的指针返回给用户。//// 返回 Handle 指针，相当于这个 Cache 缓存项的引用计数加一，即使另外一个线程// 将这个缓存项从 Cache 中移除了，该缓存项还是会保留在内存中。// 用户需要在使用完这个缓存项后，调用 Release() 方法来将该缓存项的引用计数减一。// 可以通过以下例子来理解://      Cache* cache = NewLRUCache(100);//      Handle* handle = cache->Insert("key", "value", 5, nullptr);//      cache->Erase("key"); // 即使这里将缓存项从 Cache 中移除了，但该缓存项还是会保留在内存中//      cache->Value(handle); // 此时还是可以通过 handle 获取到缓存项的 Value//      cache->Release(handle); // 这里将缓存项的引用计数减一，如果引用计数为 0，那么该缓存项会被销毁。//// charge 参数表示这个缓存项的大小，因为缓存项里只存储了 value 的指针，所以计算出// 该缓存项的大小，需要用户告知 Cache。virtual Handle* Insert(const Slice& key, void* value, size_t charge,void (*deleter)(const Slice& key, void* value)) = 0;// 通过 key 查找 Cache 中的缓存项://      - 如果找到了，返回该缓存项的 Handle 指针。//      - 同时将该缓存项的引用计数加一。如果没有找到，返回 nullptr。virtual Handle* Lookup(const Slice& key) = 0;// 将缓存项的引用计数减一，如果引用计数为 0，那么该缓存项会被销毁。virtual void Release(Handle* handle) = 0;// 返回缓存项的 Value。virtual void* Value(Handle* handle) = 0;// 指定一个 key，从 Cache 中移除一个缓存项。// 如果该缓存项的引用计数为 0，那么该缓存项会被销毁。virtual void Erase(const Slice& key) = 0;// 返回一个新的数字，作为该 Cache 的 ID。virtual uint64_t NewId() = 0;// 移除 Cache 中所有没有正在被使用的缓存项。// 比如在一些内存紧张的情况下，客户端可能会希望把 Cache 里没有正在被使用的缓存项移除，// 腾出一些内存空间。virtual void Prune() {}// 计算 Cache 中所有缓存项的大小之和。virtual size_t TotalCharge() const = 0;
};

ShardedLRUCache 的实现

ShardedLRUCache 的构造函数

ShardedLRUCache内部有一个LRUCache数组，LRUCache shard_[kNumShards]。

意思是ShardedLRUCache不是一个大Cache，而是将这个大的Cache shard 为多个小Cache，每个小Cache叫做一个shard。

所以叫做ShardedLRUCache。

// capacity: ShardedLRUCache 的总容量
// 根据总容量计算每个 shard 里的 LRUCache 的容量。
explicit ShardedLRUCache(size_t capacity) : last_id_(0) {// 计算 per_shard: 每个 shard 的容量。// per_shard = ⌈capacity / kNumShards⌉ (向上取整)const size_t per_shard = (capacity + (kNumShards - 1)) / kNumShards;for (int s = 0; s < kNumShards; s++) {// 给每个 shard 里的 LRUCache 设置容量。shard_[s].SetCapacity(per_shard);}
}

ShardedLRUCache::Insert(const Slice& key, void* value, size_t charge, void (deleter)(const Slice& key, void value))

计算key的hash值，然后根据hash值选择一个shard，将key插入到该shard的LRUCache中。

Handle* Insert(const Slice& key, void* value, size_t charge,void (*deleter)(const Slice& key, void* value)) override {// 计算 key 的 hash 值，然后根据 hash 值选择一个 shard，// 将 key 插入到该 shard 的 LRUCache 中。const uint32_t hash = HashSlice(key);return shard_[Shard(hash)].Insert(key, hash, value, charge, deleter);
}

HashSlice(key)的实现如下:

static inline uint32_t HashSlice(const Slice& s) { return Hash(s.data(), s.size(), 0); }

继续看Hash(s.data(), s.size(), 0)的实现:

LevelDB 在MurMurHash 算法的基础上做了一点修改，主要是为了提高性能。

相比于其他 Hash 算法， MurmurHash 对于规律性较强的 Key，随机分布特征表现更良好。

uint32_t Hash(const char* data, size_t n, uint32_t seed) {// Similar to murmur hashconst uint32_t m = 0xc6a4a793;const uint32_t r = 24;const char* limit = data + n;uint32_t h = seed ^ (n * m);// Pick up four bytes at a timewhile (data + 4 <= limit) {uint32_t w = DecodeFixed32(data);data += 4;h += w;h *= m;h ^= (h >> 16);}// Pick up remaining bytesswitch (limit - data) {case 3:h += static_cast<uint8_t>(data[2]) << 16;FALLTHROUGH_INTENDED;case 2:h += static_cast<uint8_t>(data[1]) << 8;FALLTHROUGH_INTENDED;case 1:h += static_cast<uint8_t>(data[0]);h *= m;h ^= (h >> r);break;}return h;
}

LRUCache::Insert(key, hash, value, charge, deleter)的实现可移步参考大白话解析LevelDB：LRUCache;

ShardedLRUCache::Lookup(const Slice& key)

Handle* Lookup(const Slice& key) override {// 使用与 Insert 相同的 Hash 算法计算 key 的 hash 值，// 找到对应的 shard，然后在该 shard 的 LRUCache 中查找 key。const uint32_t hash = HashSlice(key);return shard_[Shard(hash)].Lookup(key, hash);
}

ShardedLRUCache::Release(Handle* handle)

void Release(Handle* handle) override {// Handle 中已经存好 hash 值了，不需要重新计算。// 找到对应的 shard，然后让该 shard 的 LRUCache 释放 handle。LRUHandle* h = reinterpret_cast<LRUHandle*>(handle);shard_[Shard(h->hash)].Release(handle);
}

我们可以移步到大白话解析LevelDB：LRUCache看下LRUHandle的定义，LRUCache::Insert(key, hash, value, charge, deleter)里会将key和hash生成一个LRUHandle缓存项，该缓存项里存储了非常多的信息。

所以只要拿到handle，就可以直接读取出该缓存项的hash值了，不需要重新计算。

ShardLRUCache::Erase(const Slice& key)

void Erase(const Slice& key) override {// 使用与 Insert 相同的 Hash 算法计算 key 的 hash 值，// 找到对应的 shard，然后让该 shard 的 LRUCache 移除 key。const uint32_t hash = HashSlice(key);shard_[Shard(hash)].Erase(key, hash);
}

ShardedLRUCache::Value(Handle* handle)

handle里已经存储了value，从handle中直接获取即可。

void* Value(Handle* handle) override { return reinterpret_cast<LRUHandle*>(handle)->value; }

ShardedLRUCache::NewId()

返回一个新的数字，作为该 Cache 的 ID。

uint64_t NewId() override {MutexLock l(&id_mutex_);return ++(last_id_);
}

ShardedLRUCache::Prune()

没啥好说的，挨个调用每个 shard 里LRUCache的LRUCache::Prune()。

void Prune() override {for (int s = 0; s < kNumShards; s++) {shard_[s].Prune();}
}

ShardedLRUCache::TotalCharge()

没啥好说的，挨个调用每个 shard 里LRUCache的LRUCache::TotalCharge()。

size_t TotalCharge() const override {size_t total = 0;for (int s = 0; s < kNumShards; s++) {total += shard_[s].TotalCharge();}return total;
}

总结

可以看到，ShardedLRUCache只是一个LRUCache的封装，包含多个LRUCache shard。

插入、查找、删除等操作都是基于LRUCache的操作，只是在操作之前，需要先计算出key的hash值，然后根据hash值选择一个shard，再在该shard的LRUCache中进行操作。

接下来我们移步看下LRUCache的实现: 大白话解析LevelDB：LRUCache。

大白话解析LevelDB：ShardedLRUCache

文章目录 Cache 接口定义ShardedLRUCache 的实现ShardedLRUCache 的构造函数ShardedLRUCache::Insert(const Slice& key, void* value, size_t charge, void (\*deleter)(const Slice& key, void* value))ShardedLRUCache::Lookup(const Slice& key)ShardedLRUCach…...

编程日记 2024/3/6 4:49:16

GDOI2024游记

Day0 中午一点钟从学校出发去东莞，大概坐了一个多小时车，两点半多到酒店。住的八方精选酒店（ljh说他们住九方精选酒店，乐），说的是景区酒店，但打开外窗，近处是简陋的阳台&#xff0c…...

编程日记 2024/3/6 4:47:15

学编程怎么样才能更快入手，编程怎么简单易学

学编程怎么样才能更快入手，编程怎么简单易学一、前言对于初学编程建议先从简单入手，然后再学习其他复杂的编程语言。今天给大家分享的中文编程开发语言工具进度条构件的用法。编程入门视频教程链接 https://edu.csdn.net/course/detail/39036 …...

编程日记 2024/3/6 4:46:14

Android 通知--判断通知是否有跳转

一. 从应用层来分析在 Android 中，可以通过 PendingIntent 来实现有跳转的通知和没有跳转的通知的区别。具体来说，有跳转的通知会设置一个 PendingIntent，当用户点击通知时会触发该 PendingIntent，打开指定的界面或执行特…...

编程日记 2024/3/6 4:45:13

【计算机网络】IO多路转接之poll

文章目录一、poll函数接口二、socket就绪条件三、poll的优点四、poll的缺点五、poll使用案例--只读取数据的server服务器1.err.hpp2.log.hpp3.sock.hpp4.pollServer.hpp5.main.cc 一、poll函数接口 #include <poll.h> int poll(struct pollfd *fds, nfds_t nfds, int t…...

编程日记 2024/3/6 4:44:11

性能比较：in和exists

当在Hive SQL中使用NOT IN和NOT EXISTS时，性能差异主要取决于底层数据的组织方式、数据量大小、索引的使用情况以及具体查询的复杂程度。下面是对这两种方法的性能分析： 1. NOT IN：- 工作原理：NOT IN子查询会逐个比较主查询中的值…...

编程日记 2024/3/6 4:43:10

【Java设计模式】五、建造者模式

文章目录 1、建造者模式2、案例：共享单车的创建3、其他用途 1、建造者模式某个对象的构建复杂将复杂的对象的创建和属性赋值所分离，使得同样的构建过程可以创建不同的表示建造的过程和细节调用者不需要知道，只需要通过构建者去进行操作 …...

编程日记 2024/3/6 4:40:08

nginx代理minio教程避坑过的教程避开SignatureDoesNotMatch

本次教程使用的是单机minio进行演示，集群minio也和这个差不多。按照这个教程，可以避开nginx代理minio之后，只能访问文件，但是通过预签名url上传文件就会报SignatureDoesNotMatch的坑暂定如下： 你已经下载好miniom…...

编程日记 2024/3/6 4:39:06

Linux进程详细介绍

文章目录 Linux进程1、计算机体系结构和操作系统管理1.1、计算机体系结构 -- 硬件1.2、操作系统（Operator System） -- 软件 2、进程2.1、进程基本概念2.2、进程标识符2.2.1、获取当前进程标识符和当前进程的父进程标识符2.2.2、通过系统调用创建进程 -- …...

编程日记 2024/3/6 4:37:05

2024年3月产品认证基础考试简答题及答案

产品认证基础 46.产品认证的工厂检查有哪几种路线？各有什么优缺点？ 答案：两种常用的检查路线： 1.按照要素或过程检查按照认证规则规定的工厂应满足的要素要求（包括质量保证能力要求），结合部…...

编程日记 2024/3/6 4:36:04

嵌入式蓝桥杯做题总结

第十二届省赛按键代码 ——自认为比较巧妙，定时器3被设置为10ms进入一次中断，代替了HAL_Delay(10)的方法消抖； 运用状态机机思想实现检测多个按键检测——且分为两个状态，其中一个状态PB１和PB２的按键不…...

编程日记 2024/3/6 4:35:02

Spring Boot 常用注解大全

以下是Spring Boot中常用的注解及其详细解释以及相应的代码示例： SpringBootApplication: 这个注解用于标识一个Spring Boot应用的主类。它整合了 Configuration，EnableAutoConfiguration 和 ComponentScan。 SpringBootApplication public class Demo…...

编程日记 2024/3/6 4:33:00

（MATLAB）第十二章-数列与极限

目录 12.1 数列 12.1.1 数列求和 1. 累计求和函数sum() 2. 忽略NaN累计求和函数 nansum() 3. 求此元素位置之前的元素和函数cumsum() 4. 求梯形累计和函数cumtrapz() 12.1.2 数列求积 1. 元素连续相乘函数 prod() 2. 求累计积函数 cumprod() 3. 阶乘函数 ffactorial(n…...

编程日记 2024/3/6 4:30:58

OJ输入问题+准备

写在之前： 发现题目输入是这样的： 我的问题：如何通过空格分割这些输入的字符串并分别保存！！（C语言scanf好解决一点但我选择C....） C引入了ostringstream、istringstream、stringstream这三个类…...

编程日记 2024/3/6 4:28:56

软考高级：主动攻击和被动攻击概念和例题

作者：明明如月学长， CSDN 博客专家，大厂高级 Java 工程师，《性能优化方法论》作者、《解锁大厂思维：剖析《阿里巴巴Java开发手册》》、《再学经典：《Effective Java》独家解析》专栏作者。热门文章推荐&am…...

编程日记 2024/3/6 4:27:55

cuda python torch 虚拟环境配置

以下是Pytorch和CUDA对应的版本以下是Pytorch和Python对应的版本检查cuda与Python版本是否匹配 import torch print(torch.__version__) print(torch.cuda.is_available()) print(torch.empty(3,4,devicecuda))cuda 删除cuda conda uninstall cudatoolkit --forceconda u…...

编程日记 2024/3/6 4:25:53

激光炸弹刷题笔记

前置知识二维前缀和子矩阵的和刷题笔记 {二维前缀和}-CSDN博客思路参考二维前缀和将子矩阵的和做成动态矩阵一个个矩阵搜索符合要求边长矩阵中的元素和最大值将x1,y1用i-k,j-k表示即可 x2,y2用i，j表示代码 #include<iostream> #include<…...

编程日记 2024/3/6 4:22:51

Vue3学习记录（三）--- 组合式API之生命周期和模板引用

一、生命周期 1、简介生命周期，指的是一个 Vue 实例从创建到销毁的完整阶段，强调的是一个时间段。生命周期钩子函数，指的是 Vue 实例提供的内置函数，函数的参数为一个回调函数。这些钩子函数会在实例生命周期的某些固定…...

编程日记 2024/3/6 4:21:50

Batch Normalization和Layer Normalization和Group normalization

文章目录前言一、Group normalization二、批量规范化(Batch Normalization)三、层规范化（Layer Normalization） 前言批量规范化和层规范化在神经网络中的每个批次或每个层上进行规范化，而GroupNorm将特征分成多个组，并在每个组内…...

编程日记 2024/3/6 4:20:49

命名实体识别NER（综合代码示例）

一、命名实体识别发展方向二、中文数据集 CCKS2017开放的中文的电子病例测评相关的数据。评测任务一：https://biendata.com/competition/CCKS2017_1/ 评测任务二：https://biendata.com/competition/CCKS2017_2/ CCKS2018开放的音乐领域的实体识别任务…...

编程日记 2024/3/6 4:19:47

谷歌浏览器插件

项目中有时候会用到插件 sync-cookie-extension1.0.0：开发环境同步测试 cookie 至 localhost，便于本地请求服务携带 cookie 参考地址：https://juejin.cn/post/7139354571712757767 里面有源码下载下来，加在到扩展即可使用FeHelp…...

编程新知 2025/8/16 3:55:30

【人工智能】神经网络的优化器optimizer（二）：Adagrad自适应学习率优化器

一.自适应梯度算法Adagrad概述 Adagrad（Adaptive Gradient Algorithm）是一种自适应学习率的优化算法，由Duchi等人在2011年提出。其核心思想是针对不同参数自动调整学习率，适合处理稀疏数据和不同参数梯度差异较大的场景。Adagrad通…...

编程新知 2026/2/8 14:57:14

使用分级同态加密防御梯度泄漏

抽象联邦学习 （FL） 支持跨分布式客户端进行协作模型训练，而无需共享原始数据，这使其成为在互联和自动驾驶汽车 （CAV） 等领域保护隐私的机器学习的一种很有前途的方法。然而，最近的研究表明&…...

编程新知 2026/1/24 6:22:43

多模态商品数据接口：融合图像、语音与文字的下一代商品详情体验

一、多模态商品数据接口的技术架构 （一）多模态数据融合引擎跨模态语义对齐通过Transformer架构实现图像、语音、文字的语义关联。例如，当用户上传一张“蓝色连衣裙”的图片时，接口可自动提取图像中的颜色（RGB值&…...

编程新知 2025/7/23 3:55:49

如何在网页里填写 PDF 表格？

有时候，你可能希望用户能在你的网站上填写 PDF 表单。然而，这件事并不简单，因为 PDF 并不是一种原生的网页格式。虽然浏览器可以显示 PDF 文件，但原生并不支持编辑或填写它们。更糟的是，如果你想收集表单数据&#xff…...

编程新知 2026/2/6 22:20:51

Git常用命令完全指南：从入门到精通

Git常用命令完全指南：从入门到精通一、基础配置命令 1. 用户信息配置 # 设置全局用户名 git config --global user.name "你的名字"# 设置全局邮箱 git config --global user.email "你的邮箱example.com"# 查看所有配置 git config --list…...

编程新知 2025/10/3 0:40:01

【从零开始学习JVM | 第四篇】类加载器和双亲委派机制(高频面试题)

前言： 双亲委派机制对于面试这块来说非常重要，在实际开发中也是经常遇见需要打破双亲委派的需求，今天我们一起来探索一下什么是双亲委派机制，在此之前我们先介绍一下类的加载器。目录编辑前言： 类加载器 1. …...

编程新知 2026/1/23 7:37:12

第一篇：Liunx环境下搭建PaddlePaddle 3.0基础环境（Liunx Centos8.5安装Python3.10+pip3.10）

第一篇：Liunx环境下搭建PaddlePaddle 3.0基础环境（Liunx Centos8.5安装Python3.10pip3.10） 一：前言二：安装编译依赖二：安装Python3.10三：安装PIP3.10四：安装Paddlepaddle基础框架4.1…...

编程新知 2026/1/31 20:22:32

基于stm32F10x 系列微控制器的智能电子琴（附完整项目源码、详细接线及讲解视频）

注：文章末尾网盘链接中自取成品使用演示视频、项目源码、项目文档所用硬件：STM32F103C8T6、无源蜂鸣器、44矩阵键盘、flash存储模块、OLED显示屏、RGB三色灯、面包板、杜邦线、usb转ttl串口 stm32f103c8t6 面包板 …...

编程新知 2026/1/26 9:04:42

2025.6.9总结（利与弊）

凡事都有两面性。在大厂上班也不例外。今天找开发定位问题，从一个接口人不断溯源到另一个接口人。有时候，不知道是谁的责任填。将工作内容分的很细，每个人负责其中的一小块。我清楚的意识到，自己就是个可以随时替换的螺丝钉&…...

编程新知 2025/10/14 3:13:44