postgresql源码学习(59)—— 磁盘管理器 SMGR
一、 定义及作用
PostgreSQL 的磁盘管理器(Storage Manager,简称 SMGR)是数据库系统中负责管理底层存储的核心模块。磁盘管理器并非直接操作磁盘上的文件,而是通过VFD(虚拟文件描述符,将在后续学习)实现。
-
抽象存储层,解耦存储逻辑:
SMGR 提供了一层抽象接口,屏蔽了不同存储类型(如表、索引、TOAST 表等)的底层细节,使上层模块(如执行器、缓冲池)无需关心具体的存储实现。 -
管理文件操作:
SMGR 负责文件的创建、删除、扩展、截断等操作,确保数据文件能够高效地存储和访问。 -
支持多种存储类型:
PostgreSQL 支持多种存储类型(如堆表、索引、TOAST 表等),SMGR 通过统一的接口管理这些存储类型。 -
与缓冲池交互:
SMGR 与缓冲池(Buffer Manager)紧密协作,确保数据页能够正确地加载到内存中。 -
提高可扩展性:
通过 SMGR 的抽象接口,PostgreSQL 可以更容易地支持新的存储类型或存储引擎(如列存储、外部表等)。
二、 核心数据结构
src/include/storage/smgr.h SMGR 的头文件,定义了存储管理器的接口和数据结构。
SMgrRelation:SMGR的核心数据结构,主要作用是:
- 管理文件句柄:缓存关系的文件句柄,避免频繁打开和关闭文件。
- 支持多分支(Fork):PostgreSQL 中的表或索引可能包含多个分支(如主数据分支、TOAST 分支等),SMgrRelationData 支持管理这些分支的文件。
- 缓存文件大小:记录每个分支的最后一个已知大小,用于优化文件扩展操作。
- 支持临时关系:通过 smgr_owner 指针区分临时关系和持久关系,临时关系在事务结束时自动释放
/** smgr.c 维护了一个 SMgrRelation 对象表,这些对象本质上是缓存的文件句柄。* SMgrRelation 通过 smgropen() 创建(如果尚未存在),并通过 smgrclose() 销毁。* 注意,这些操作并不涉及 I/O,它们只是创建或销毁哈希表条目。* (但 smgrclose() 可能会释放相关资源,例如操作系统级别的文件描述符。)** 一个 SMgrRelation 可能有一个“所有者”,这只是从其他地方指向它的指针;* 如果 SMgrRelation 被关闭,smgr.c 会清除此指针。* 我们使用此机制来避免从 relcache 到 smgr 的悬空指针,而无需让 smgr 显式感知 relcache。* 每个 SMgrRelation 只能有一个“所有者”指针,但这已经足够。** 没有“所有者”的 SMgrRelation 被认为是临时的,并在事务结束时被删除。*/typedef struct SMgrRelationData
{/* rnode 是哈希表查找键,因此必须放在第一位! */RelFileNodeBackend smgr_rnode; /* 表的物理标识符 *//* 指向所有者指针的指针,如果没有则为 NULL */struct SMgrRelationData **smgr_owner;/** 以下字段在缓存刷新事件时重置为 InvalidBlockNumber,* 并记录每个分支的最后一个已知大小。* 此信息目前仅在恢复期间可靠,因为分支扩展没有缓存失效机制。*/BlockNumber smgr_targblock; /* 当前插入目标块 */BlockNumber smgr_cached_nblocks[MAX_FORKNUM + 1]; /* 每个分支的最后一个已知大小 *//* 未来可能会在此处添加其他公共字段 *//** 以下字段是 smgr.c 及其子模块私有的。* 不要从其他地方修改它们。*/int smgr_which; /* 存储管理器选择器 *//** 用于 md.c;每个分支的打开段数量(md_num_open_segs)* 和段本身(md_seg_fds)。*/int md_num_open_segs[MAX_FORKNUM + 1];struct _MdfdVec *md_seg_fds[MAX_FORKNUM + 1];/* 如果没有所有者,则链接到所有无所有者 SMgrRelations 的链表中 */dlist_node node;
} SMgrRelationData;typedef SMgrRelationData *SMgrRelation;
三、 核心函数
1. smgrinit(void)
-
作用:初始化存储管理器模块。
-
说明:在 PostgreSQL 启动时调用,用于初始化 SMGR 的全局状态(如哈希表、锁等)。
2. smgropen(RelFileNode rnode, BackendId backend)
-
作用:打开一个关系的存储管理器(
SMgrRelation)。 -
参数:
-
rnode:关系的物理标识符(RelFileNode)。 -
backend:后端 ID,用于区分不同后端进程。
-
-
返回值:返回一个
SMgrRelation对象,表示关系的存储管理器。
3. smgrexists(SMgrRelation reln, ForkNumber forknum)
-
作用:检查指定分叉(Fork)的文件是否存在。
-
参数:
-
reln:关系的存储管理器。 -
forknum:分叉编号(如主数据分叉、TOAST 分叉等)。
-
-
返回值:如果文件存在,返回
true;否则返回false。
4. smgrsetowner(SMgrRelation *owner, SMgrRelation reln)
-
作用:设置关系的所有者。
-
参数:
-
owner:指向所有者指针的指针。 -
reln:关系的存储管理器。
-
-
说明:用于将
reln的所有者设置为owner,避免悬空指针问题。
5. smgrclearowner(SMgrRelation *owner, SMgrRelation reln)
-
作用:清除关系的所有者。
-
参数:
-
owner:指向所有者指针的指针。 -
reln:关系的存储管理器。
-
-
说明:用于清除
reln的所有者,通常在关系关闭时调用。
6. smgrclose(SMgrRelation reln)
-
作用:关闭一个关系的存储管理器。
-
参数:
-
reln:关系的存储管理器。
-
-
说明:释放与
reln相关的资源(如文件描述符),并将其从哈希表中移除。
7. smgrcloseall(void)
-
作用:关闭所有关系的存储管理器。
-
说明:在事务结束时调用,用于清理所有临时关系的存储管理器。
8. smgrclosenode(RelFileNodeBackend rnode)
-
作用:关闭指定关系的存储管理器。
-
参数:
-
rnode:关系的物理标识符。
-
-
说明:根据
rnode查找并关闭对应的存储管理器。
9. smgrcreate(SMgrRelation reln, ForkNumber forknum, bool isRedo)
-
作用:创建一个新的分叉文件。
-
参数:
-
reln:关系的存储管理器。 -
forknum:分叉编号。 -
isRedo:是否在恢复期间调用。
-
-
说明:用于创建表或索引的分叉文件(如主数据文件、TOAST 文件等)。
10. smgrdosyncall(SMgrRelation *rels, int nrels)
-
作用:同步所有指定关系的文件到磁盘。
-
参数:
-
rels:存储管理器数组。 -
nrels:数组长度。
-
-
说明:确保所有修改过的文件数据被写入磁盘。
11. smgrdounlinkall(SMgrRelation *rels, int nrels, bool isRedo)
-
作用:删除所有指定关系的文件。
-
参数:
-
rels:存储管理器数组。 -
nrels:数组长度。 -
isRedo:是否在恢复期间调用。
-
-
说明:用于删除表或索引的分叉文件。
12. smgrextend(SMgrRelation reln, ForkNumber forknum, BlockNumber blocknum, char *buffer, bool skipFsync)
-
作用:扩展指定分叉的文件,并写入数据。
-
参数:
-
reln:关系的存储管理器。 -
forknum:分叉编号。 -
blocknum:要写入的块号。 -
buffer:要写入的数据。 -
skipFsync:是否跳过同步到磁盘。
-
-
说明:用于扩展文件并写入数据块。
13. smgrprefetch(SMgrRelation reln, ForkNumber forknum, BlockNumber blocknum)
-
作用:预取指定分叉的数据块。
-
参数:
-
reln:关系的存储管理器。 -
forknum:分叉编号。 -
blocknum:要预取的块号。
-
-
返回值:如果预取成功,返回
true;否则返回false。
14. smgrread(SMgrRelation reln, ForkNumber forknum, BlockNumber blocknum, char *buffer)
-
作用:从指定分叉的文件中读取数据块。
-
参数:
-
reln:关系的存储管理器。 -
forknum:分叉编号。 -
blocknum:要读取的块号。 -
buffer:存储读取数据的缓冲区。
-
-
说明:用于从文件中读取数据块到内存。
15. smgrwrite(SMgrRelation reln, ForkNumber forknum, BlockNumber blocknum, char *buffer, bool skipFsync)
-
作用:将数据块写入指定分叉的文件。
-
参数:
-
reln:关系的存储管理器。 -
forknum:分叉编号。 -
blocknum:要写入的块号。 -
buffer:要写入的数据。 -
skipFsync:是否跳过同步到磁盘。
-
-
说明:用于将数据块写入文件。
16. smgrwriteback(SMgrRelation reln, ForkNumber forknum, BlockNumber blocknum, BlockNumber nblocks)
-
作用:将指定范围内的数据块写回磁盘。
-
参数:
-
reln:关系的存储管理器。 -
forknum:分叉编号。 -
blocknum:起始块号。 -
nblocks:要写回的块数。
-
-
说明:用于批量写回数据块,优化 I/O 性能。
17. smgrnblocks(SMgrRelation reln, ForkNumber forknum)
-
作用:获取指定分叉的文件大小(块数)。
-
参数:
-
reln:关系的存储管理器。 -
forknum:分叉编号。
-
-
返回值:文件的大小(块数)。
18. smgrnblocks_cached(SMgrRelation reln, ForkNumber forknum)
-
作用:获取指定分叉的文件大小(块数),使用缓存值。
-
参数:
-
reln:关系的存储管理器。 -
forknum:分叉编号。
-
-
返回值:文件的大小(块数)。
-
说明:与
smgrnblocks类似,但使用缓存值以提高性能。
19. smgrtruncate(SMgrRelation reln, ForkNumber *forknum, int nforks, BlockNumber *nblocks)
-
作用:截断指定分叉的文件到指定大小。
-
参数:
-
reln:关系的存储管理器。 -
forknum:分叉编号数组。 -
nforks:分叉数量。 -
nblocks:每个分叉的目标大小(块数)。
-
-
说明:用于截断文件,释放多余的空间。
20. smgrimmedsync(SMgrRelation reln, ForkNumber forknum)
-
作用:立即同步指定分叉的文件到磁盘。
-
参数:
-
reln:关系的存储管理器。 -
forknum:分叉编号。
-
-
说明:确保文件的修改被立即写入磁盘。
21. AtEOXact_SMgr(void)
-
作用:在事务结束时清理存储管理器。
-
说明:用于释放临时关系的存储管理器,清理缓存等。
参考:《PostgreSQL 数据库内核分析》
相关文章:
postgresql源码学习(59)—— 磁盘管理器 SMGR
一、 定义及作用 PostgreSQL 的磁盘管理器(Storage Manager,简称 SMGR)是数据库系统中负责管理底层存储的核心模块。磁盘管理器并非直接操作磁盘上的文件,而是通过VFD(虚拟文件描述符,将在后续学习…...
Spring Boot(8)深入理解 @Autowired 注解:使用场景与实战示例
搞个引言 在 Spring 框架的开发中,依赖注入(Dependency Injection,简称 DI)是它的一个核心特性,它能够让代码更加模块化、可测试,并且易于维护。而 Autowired 注解作为 Spring 实现依赖注入的关键工具&…...
UE_C++ —— Structs
目录 一,实现一个UStruct 二,Struct Specifiers 三,最佳做法与技巧 结构体(Struct)是一种帮助组织和操作相关属性的数据结构;在引擎中,结构体会被引擎反射系统识别为 UStruct,但不…...
ArcGISPro 新建shp+数据结构
import arcpy# 设置工作空间和 Shapefile 存放路径 shp_path r"C:\path\to\your\folder\PolygonZY.shp" # Shapefile 存放路径 fields [("CHBH", "TEXT", 20),("ZCMC", "TEXT", 100),("ZCLX", "TEXT"…...
DeepSeek教unity------MessagePack-06
无类型 Typeless 无类型的 API 类似于 BinaryFormatter,因为它会将类型信息嵌入到数据块中,所以在调用 API 时不需要显式指定类型。 MessagePackSerializer.Typeless 是 Serialize/Deserialize<object>(TypelessContractlessStandardResolver.In…...
2.【BUUCTF】bestphp‘s revenge
进入题目页面如下 进行代码审计 <?php // 1. 高亮显示当前PHP文件的源代码,方便开发者查看代码内容,在生产环境中不应使用此函数,可能会导致代码泄露。 highlight_file(__FILE__);// 2. 定义变量 $b ,其值为字符串 implode &…...
《刚刚问世》系列初窥篇-Java+Playwright自动化测试-23- 操作鼠标拖拽 - 番外篇(详细教程)
拉票 亲爱的小伙伴们或者童鞋们,喜欢宏哥文章的,请动动你们发财小手,给我投投票票 。 祝2025小伙伴们工作顺利,家庭和睦,心想事成,财源滚滚! 我的票还有7票,互票的朋友私信给我。 投…...
Netty源码解析之异步处理(二):盛赞Promise中的集合设计
前言 在阅读Netty源码的过程中,我越来越相信一句话:“Netty的源码非常好,质量极高,是Java中质量最高的开源项目之一”。如果认真研究,会有一种遍地黄金的感觉。 本篇文件我将记录一下鄙人在Promise的实现类DefaultPr…...
NetworkX布局算法:nx.spring_layout
诸神缄默不语-个人CSDN博文目录 官方文档:https://networkx.org/documentation/stable/reference/generated/networkx.drawing.layout.spring_layout.html 和nx.fruchterman_reingold_layout()等价。 这个函数主要是为了在可视化NetworkX图时设置节点分布布局的&…...
Navicat导入海量Excel数据到数据库(简易介绍)
目录 前言正文 前言 此处主要作为科普帖进行记录 原先Java处理海量数据的导入时,由于接口超时,数据处理不过来,后续转为Navicat Navicat 是一款功能强大的数据库管理工具,支持多种数据库系统(如 MySQL、PostgreSQL、…...
LeetCodehot100 力扣热题100 二叉树展开为链表
代码思路 目标: 将二叉树展平(flatten)为一个单链表。展平后的链表应该按照前序遍历的顺序排列节点,即: • 节点的左子树指针设置为 nullptr。 • 节点的右子树指针指向下一个节点。 代码注释及思路 class Solution…...
2.14学习总结
#include <stdio.h> #include <stdlib.h> #include <math.h>#define MAX_N 32767// 二分查找最接近目标值的元素 int binarySearch(int* arr, int left, int right, int target) {while (left < right) {int mid left (right - left) / 2;if (arr[mid] …...
在WPS中通过JavaScript宏(JSA)调用本地DeepSeek API优化文档教程
既然我们已经在本地部署了DeepSeek,肯定希望能够利用本地的模型对自己软件开发、办公文档进行优化使用,接下来就先在WPS中通过JavaScript宏(JSA)调用本地DeepSeek API优化文档的教程奉上。 前提: (1)已经部署好了DeepSeek,可以看我的文章:个人windows电脑上安装DeepSe…...
zola + github page,用 workflows 部署
之前的Zola都是本地build之后,再push到github上,这种方式很明显的弊端就是只能在本地编辑,而不能通过github编辑,再pull到本地,缺乏了灵活性。因此将zola用workflows来部署。 repo地址:https://github.com/…...
【科技革命】颠覆性力量与社会伦理的再平衡
目录 2025年科技革命:颠覆性力量与社会伦理的再平衡目录技术突破全景图认知智能的范式转移量子霸权实现路径生物编程技术革命能源结构重构工程 产业生态链重构医疗健康新范式教育系统智能进化金融基础设施变革制造范式革命 科技伦理与文明演进 2025年科技革命&#…...
UIView 与 CALayer 的联系和区别
今天说一下UIView 与 CALayer 一、UIView 和 CALayer 的关系 在 iOS 开发中,UIView 是用户界面的基础,它负责处理用户交互和绘制内容,而 CALayer 是 UIView 内部用于显示内容的核心图层(Layer)。每个 UIView 内部都有…...
Jenkins 新建配置 Freestyle project 任务 六
Jenkins 新建配置 Freestyle project 任务 六 一、新建任务 在 Jenkins 界面 点击 New Item 点击 Apply 点击 Save 回到任务主界面 二、General 点击左侧 Configure Description:任务描述 勾选 Discard old builds Discard old builds:控制何时…...
深入解析A2DP v1.4协议:蓝牙高质量音频传输的技术与实现
1. A2DP概述 A2DP(Advanced Audio Distribution Profile)是一种高质量音频流媒体协议,旨在实现高质量音频内容的分发,通常用于通过蓝牙设备传输音频数据,例如将音乐从便携式播放器传输到耳机或扬声器。与传统的蓝牙语…...
mybatis-plus逆向code generator pgsql实践
mybatis-plus逆向code generator pgsql实践 环境准备重要工具的版本供参考pom依赖待逆向的SQL 配置文件CodeGenerator配置类配置类说明 环境准备 重要工具的版本 jdk1.8.0_131springboot 2.7.6mybatis-plus 3.5.7pgsql 14.15 供参考pom依赖 <?xml version"1.0&quo…...
Android Studio:RxBus结合ICompositeSubscription使用
我现在想用 RxBus 来发布和订阅事件,同时使用 ICompositeSubscription 来管理订阅。跟前一个博客的区别在于,事件流的产生方式不同,更加得全面。 目标 使用 RxBus 发布事件。使用 ICompositeSubscription 来管理订阅。在 Activity 中创建订…...
Java 语言特性(面试系列2)
一、SQL 基础 1. 复杂查询 (1)连接查询(JOIN) 内连接(INNER JOIN):返回两表匹配的记录。 SELECT e.name, d.dept_name FROM employees e INNER JOIN departments d ON e.dept_id d.dept_id; 左…...
多模态2025:技术路线“神仙打架”,视频生成冲上云霄
文|魏琳华 编|王一粟 一场大会,聚集了中国多模态大模型的“半壁江山”。 智源大会2025为期两天的论坛中,汇集了学界、创业公司和大厂等三方的热门选手,关于多模态的集中讨论达到了前所未有的热度。其中,…...
【杂谈】-递归进化:人工智能的自我改进与监管挑战
递归进化:人工智能的自我改进与监管挑战 文章目录 递归进化:人工智能的自我改进与监管挑战1、自我改进型人工智能的崛起2、人工智能如何挑战人类监管?3、确保人工智能受控的策略4、人类在人工智能发展中的角色5、平衡自主性与控制力6、总结与…...
汽车生产虚拟实训中的技能提升与生产优化
在制造业蓬勃发展的大背景下,虚拟教学实训宛如一颗璀璨的新星,正发挥着不可或缺且日益凸显的关键作用,源源不断地为企业的稳健前行与创新发展注入磅礴强大的动力。就以汽车制造企业这一极具代表性的行业主体为例,汽车生产线上各类…...
微信小程序 - 手机震动
一、界面 <button type"primary" bindtap"shortVibrate">短震动</button> <button type"primary" bindtap"longVibrate">长震动</button> 二、js逻辑代码 注:文档 https://developers.weixin.qq…...
聊一聊接口测试的意义有哪些?
目录 一、隔离性 & 早期测试 二、保障系统集成质量 三、验证业务逻辑的核心层 四、提升测试效率与覆盖度 五、系统稳定性的守护者 六、驱动团队协作与契约管理 七、性能与扩展性的前置评估 八、持续交付的核心支撑 接口测试的意义可以从四个维度展开,首…...
九天毕昇深度学习平台 | 如何安装库?
pip install 库名 -i https://pypi.tuna.tsinghua.edu.cn/simple --user 举个例子: 报错 ModuleNotFoundError: No module named torch 那么我需要安装 torch pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple --user pip install 库名&#x…...
Fabric V2.5 通用溯源系统——增加图片上传与下载功能
fabric-trace项目在发布一年后,部署量已突破1000次,为支持更多场景,现新增支持图片信息上链,本文对图片上传、下载功能代码进行梳理,包含智能合约、后端、前端部分。 一、智能合约修改 为了增加图片信息上链溯源,需要对底层数据结构进行修改,在此对智能合约中的农产品数…...
AI病理诊断七剑下天山,医疗未来触手可及
一、病理诊断困局:刀尖上的医学艺术 1.1 金标准背后的隐痛 病理诊断被誉为"诊断的诊断",医生需通过显微镜观察组织切片,在细胞迷宫中捕捉癌变信号。某省病理质控报告显示,基层医院误诊率达12%-15%,专家会诊…...
基于Java+MySQL实现(GUI)客户管理系统
客户资料管理系统的设计与实现 第一章 需求分析 1.1 需求总体介绍 本项目为了方便维护客户信息为了方便维护客户信息,对客户进行统一管理,可以把所有客户信息录入系统,进行维护和统计功能。可通过文件的方式保存相关录入数据,对…...
