当前位置：首页 > article >正文

PostgreSQL 的扩展pg_prewarm

article 2026/2/8 2:02:53

PostgreSQL 的扩展pg_prewarm

pg_prewarm 是 PostgreSQL 提供的一个实用扩展，用于将数据预先加载到共享缓冲区或操作系统缓存中，从而提升查询性能。

一、扩展概述

核心功能

手动预热：将指定的表或索引数据加载到内存
自动预热：重启后恢复之前的缓存状态
两级缓存：支持加载到 PostgreSQL 缓冲区或操作系统缓存

适用场景

数据库重启后的性能恢复
关键业务查询的预热
性能测试前的环境准备
定期维护后的缓存重建

二、安装与基本操作

1. 安装扩展

CREATE EXTENSION pg_prewarm;-- 验证安装
SELECT * FROM pg_available_extensions WHERE name = 'pg_prewarm';

2. 基本函数

-- 预热整个表（包括索引）
SELECT pg_prewarm('table_name');-- 预热特定模式下的表
SELECT pg_prewarm('schema_name.table_name');-- 预热特定索引
SELECT pg_prewarm('index_name'::regclass);

三、函数参数详解

函数签名

pg_prewarm(regclass, mode text default 'buffer', fork text default 'main',first_block int8 default null, last_block int8 default null)

参数说明

参数	类型	说明
`regclass`	表/索引OID	要预热的关系对象
`mode`	text	`'buffer'`(PG缓冲区), `'read'`(OS缓存), `'prefetch'`(异步预取)
`fork`	text	`'main'`(主数据), `'fsm'`(空闲空间图), `'vm'`(可见性图)
`first_block`	int8	起始块号
`last_block`	int8	结束块号

四、实用场景示例

1. 预热关键业务表

-- 预热完整表到PG缓冲区
SELECT pg_prewarm('orders', 'buffer');-- 预热到操作系统缓存
SELECT pg_prewarm('order_items', 'read');-- 只预热前1000个块
SELECT pg_prewarm('customers', 'buffer', 'main', 0, 999);

2. 自动重启预热

-- 创建预热函数
CREATE OR REPLACE FUNCTION auto_prewarm() RETURNS void AS $$
DECLAREr RECORD;
BEGINFOR r IN SELECT relname FROM pg_class cJOIN pg_namespace n ON c.relnamespace = n.oidWHERE c.relkind IN ('r','i') AND n.nspname NOT IN ('pg_catalog', 'information_schema')LOOPEXECUTE format('SELECT pg_prewarm(%L, ''buffer'')', r.relname);END LOOP;
END;
$$ LANGUAGE plpgsql;-- 设置数据库启动时执行
ALTER SYSTEM SET shared_preload_libraries = 'pg_prewarm';
ALTER SYSTEM SET pg_prewarm.autoprewarm = on;
SELECT pg_reload_conf();

3. 定期维护脚本

#!/bin/bash
# 每周预热热门表
PGPASSWORD=$DB_PASS psql -h $DB_HOST -U $DB_USER -d $DB_NAME <<EOF
SELECT pg_prewarm('hot_table1', 'buffer');
SELECT pg_prewarm('hot_table2', 'read');
EOF

五、高级用法

1. 结合pg_stat_user_tables

-- 预热最常访问的表
SELECT pg_prewarm(schemaname||'.'||relname, 'buffer')
FROM pg_stat_user_tables
ORDER BY seq_scan + idx_scan DESC
LIMIT 10;

2. 块级精确预热

-- 只预热特定范围的块
SELECT pg_prewarm('large_table','buffer','main',(SELECT min(ctid::text::point)[0]::int8 FROM large_table WHERE create_date > '2023-01-01'),(SELECT max(ctid::text::point)[0]::int8 FROM large_table WHERE create_date > '2023-01-01')
);

3. 并行预热大表

-- 使用dblink并行预热
SELECT dblink_connect('conn1', 'dbname=mydb');
SELECT dblink_connect('conn2', 'dbname=mydb');-- 分片预热
SELECT dblink_send_query('conn1', 'SELECT pg_prewarm(''big_table'', ''buffer'', ''main'', 0, 100000)');
SELECT dblink_send_query('conn2', 'SELECT pg_prewarm(''big_table'', ''buffer'', ''main'', 100001, 200000)');

六、性能注意事项

资源消耗：
- 预热过程会消耗大量I/O和内存带宽
- 建议在低峰期执行大规模预热

模式选择：

-- 三种模式对比
/*
buffer: 加载到PG共享缓冲区（最快但容量有限）
read:   加载到OS页面缓存（不挤占PG缓冲区）
prefetch: 异步预取（不等待完成）
*/

监控方法：

-- 查看预热效果
SELECT c.relname, COUNT(*) AS buffers
FROM pg_buffercache b
JOIN pg_class c ON b.relfilenode = pg_relation_filenode(c.oid)
WHERE c.relname = 'prewarmed_table'
GROUP BY c.relname;

七、与类似工具对比

特性	pg_prewarm	pgfincore	os预热工具
内置PG支持	✔	✖ (第三方扩展)	✖
精确控制预热范围	✔	✔	✖
支持操作系统缓存	✔	✔	✔
自动重启恢复	✔	✖	✖

八、生产环境建议

关键表预热：

-- 每日任务预热TOP10表
SELECT pg_prewarm(relid::regclass, 'buffer')
FROM pg_stat_user_tables
ORDER BY idx_scan + seq_scan DESC
LIMIT 10;

配置优化：

# postgresql.conf
shared_buffers = 8GB                # 足够容纳预热数据
pg_prewarm.autoprewarm = on         # 启用自动预热
pg_prewarm.autoprewarm_interval = 300  # 每5分钟保存状态

避免过度使用：

不要预热很少访问的表
监控缓冲区命中率调整策略

SELECT sum(heap_blks_hit) / nullif(sum(heap_blks_hit + heap_blks_read), 0) 
FROM pg_statio_user_tables;

pg_prewarm 是PostgreSQL性能调优工具箱中的重要组件，合理使用可以显著减少冷启动后的性能波动，但需要根据实际业务负载设计预热策略。

PostgreSQL 的扩展pg_prewarm

PostgreSQL 的扩展pg_prewarm pg_prewarm 是 PostgreSQL 提供的一个实用扩展，用于将数据预先加载到共享缓冲区或操作系统缓存中，从而提升查询性能。一、扩展概述核心功能手动预热：将指定的表或索引数据加载到内存自动预热：…...

编程日记 2025/12/15 23:19:01

F5 – TCP 连接管理：会话、池级和节点级操作

在 F5 BIG-IP 中，您可以在池成员级别或节点级别管理流向服务器的流量。节点级别状态会影响与该节点关联的所有池，而池成员状态则仅限于单个池。了解每种方法以及何时使用它们对于顺利进行维护窗口和流量管理至关重要。池级状态：启用、禁用、强制离线、移除在 BIG-IP 配置…...

编程日记 2025/10/29 19:13:24

金融预测模型开发：数据预处理、机器学习预测与交易策略优化

金融预测模型开发：数据预处理、机器学习预测与交易策略优化概述本文将详细介绍一个完整的金融预测模型开发流程，包含数据预处理、机器学习预测和交易策略优化三个核心模块。我们使用Python实现一个端到端的解决方案，适用于股票价格预测和量化交易策略开发。 # 导入必要…...

编程日记 2026/1/15 5:22:11

【P2P】直播网络拓扑及编码模式

以下从 P2P 直播的常见拓扑模式出发，分析各种方案的特点与适用场景，并给出推荐。一、P2P 直播的核心挑战实时性要求高直播场景下，延迟必须控制在可接受范围（通常 <2 秒），同时要保证画面连贯、不卡顿。带宽分布不均每个节点（观众）上传带宽与下载带宽差异较大，且…...

编程日记 2026/1/26 18:48:49

Python数据可视化科技图表绘制系列教程（二）

目录表格风格图使用Seaborn函数绘图设置图表风格设置颜色主题图表分面绘图过程使用绘图函数绘图定义主题分面1 分面2 【声明】：未经版权人书面许可，任何单位或个人不得以任何形式复制、发行、出租、改编、汇编、传播、展示或利用本博…...

编程日记 2026/2/5 14:47:00

低空城市场景下的多无人机任务规划与动态协调！CoordField：无人机任务分配的智能协调场

作者：Tengchao Zhang 1 ^{1} 1 , Yonglin Tian 2 ^{2} 2 , Fei Lin 1 ^{1} 1, Jun Huang 1 ^{1} 1, Patrik P. Sli 3 ^{3} 3, Rui Qin 2 , 4 ^{2,4} 2,4, and Fei-Yue Wang 5 , 1 ^{5,1} 5,1单位： 1 ^{1} 1澳门科技大学创新工程学院工程科学系&#xff0…...

编程日记 2026/1/26 15:41:15

算法-构造题

#include<iostream> #include<bits/stdc.h> using namespace std; typedef long long ll; const ll N 5e5 10; int main() {ll n, k;cin >> n >> k; ll a[N] {0}; // 初始化一个大小为N的数组a，用于存储排列// 构造满足条件的排列for (l…...

编程日记 2026/1/26 20:53:53

Go 并发编程深度指南

Go 并发编程深度指南 Go 语言以其内置的并发原语而闻名，通过 goroutine 和 channel 提供了一种高效、安全的并发编程模型。本文将全面解析 Go 的并发机制及其实际应用。核心概念：Goroutines 和 Channels 1. Goroutines (协程) Go 的轻量级线程实现&…...

编程日记 2025/12/7 1:41:39

PostgreSQL 的扩展pg_freespacemap

PostgreSQL 的扩展pg_freespacemap pg_freespacemap 是 PostgreSQL 提供的一个内置扩展，用于查看表的空闲空间映射（Free Space Map, FSM）信息。这个扩展对于数据库性能调优和空间管理非常有用。一扩展概述功能：提供对表的空…...

编程日记 2025/9/16 15:05:49

【Linux】进程的基本概念

目录概念描述进程-PCB如何查看进程通过系统目录进行查看通过ps指令进行查看通过系统调用获取进程的PID和PPID(进程标⽰符)通过系统调用创建子进程通过一段代码来介绍fork为什么要有子进程？fork为什么给子进程返回0，给父进程返回子进程的PIDfork函数到底…...

编程日记 2026/1/26 16:35:07

设备驱动与文件系统：05 文件使用磁盘的实现

从文件使用磁盘的实现逻辑分享我们现在讲第30讲，内容是文件使用磁盘的具体实现，也就是相关代码是如何编写的。上一节我们探讨了如何从字符流位置算出盘块号，这是文件操作磁盘的核心。而这节课，我们将深入研究实现这一核心功能的…...

编程日记 2026/1/26 20:17:49

AI数据分析在体育中的应用：技术与实践

在现代体育竞技领域，"数据驱动"已不再是一个遥远的概念。尤其随着人工智能（AI）和大数据分析的不断成熟，从职业俱乐部到赛事直播平台，从运动员训练到球迷观赛体验，AI正以前所未有的方式渗透并改变…...

编程日记 2026/2/3 8:14:50

zabbix 6 监控 docker 容器

zabbix 6 监控 docker 容器 1.安装zabbix_agent2 curl -s http://10.26.211.56:8080/centos7-agent2-install.sh | bash2.在zabbix server 端测试 zabbix_get -s 10.26.219.180 -k docker.infoZBX_NOTSUPPORTED: Cannot fetch data: Get "http://1.28/info": dial…...

编程日记 2026/1/26 17:47:49

正则持续学习呀

源匹配为 (.*): (.*)$ 替换匹配为 "$1": "$2", 可将headers改为字典参考【爬虫军火库】如何优雅地复制请求头 - 知乎...

编程日记 2026/1/27 3:33:45

【Go语言基础【19】】接口：灵活实现多态的核心机制

文章目录零、概述一、接口基础1、接口的基本概念a. 接口定义b. 类型实现接口（无需显式声明）c. 接口变量（体现了多态） 2、实现接口的方式3、接口组合4、接口的底层结构二、空接口与类型断言1. 空接口（interface{}&…...

编程日记 2025/10/12 9:56:27

MySql读写分离部署（一主一从,双主双从,Mycat）

参考资料：参考视频参考博客视频参考资料及安装包： https://pan.baidu.com/s/1xT_WokN_xlRv0h06b6F3yg 提取码: aag3 Mysql主从复制部署指南（一主一从） NotePad++编辑Linux服务器文档 Mysql高版本（8.0及以后）Linux安装 Mysql分库分表（基于Mycat）的基本部署 …...

编程日记 2025/10/6 22:29:59

Go基本语法——go语言中的四种变量定义方法

前言在go语言中，定义一个变量有四种方式，本文单从语法的层面来介绍这几种方式单变量定义方法 1.var 变量名类型，不进行初始化例如，定义一个变量a后为其赋值，并且打印其值，运行结果如下 //1.不进行…...

编程日记 2026/1/27 12:40:32

27.【新型数据架构】-数据共享架构

27.【新型数据架构】-数据共享架构：降低数据获取成本，实时数据访问，保持数据新鲜度，促进数据经济发展，打破数据孤岛，标准化数据交换，增强数据安全性，完整审计追踪，合规性保障一、数据共享架构的本质：打破壁垒的“数字立交桥” 传统企业或组织间的数据往往呈现“烟囱…...

编程日记 2026/2/6 12:43:02

virtualbox 如何虚拟机ip固定

1、在网络管理里新建 2、配置网络 3、进入linux系统，查看查看网卡是enp0s8, ifconfig 4、进入网卡配置文件 cd /etc/sysconfig/network-scripts如果没有enp0s8 ，则使用mv ifcfg-enp0s3 ifcfg-enp0s8命令配置项如下 TYPEEthernet PROXY_METHODn…...

编程日记 2026/1/27 15:04:59

RKNN3588上部署 RTDETRV2

RT-DETR V2 是由百度研究团队在 2024年提出的，是其广受好评的实时目标检测模型 RT-DETR 的重大升级版本。它继承了第一代 RT-DETR 利用 Transformer 架构实现端到端目标检测和卓越实时性能的核心优势，并针对模型精度、训练效率和部署灵活性进行了全方…...

编程日记 2026/1/29 4:31:56

Python----循环神经网络（BiLSTM：双向长短时记忆网络）

一、LSTM 与 BiLSTM对比 1.1、LSTM LSTM（长短期记忆网络） 是一种改进的循环神经网络（RNN），专门解决传统RNN难以学习长期依赖的问题。它通过遗忘门、输入门和输出门来控制信息的流动，保留重要信息并丢弃无关…...

编程日记 2026/1/29 12:24:18

Elasticsearch 常用操作命令整合 (cURL 版本)

Elasticsearch 常用操作命令整合 (cURL 版本) 集群管理查看集群健康状态 curl -X GET "localhost:9200/_cluster/health?pretty"查看节点信息 curl -X GET "localhost:9200/_cat/nodes?v"查看集群统计信息 curl -X GET "localhost:9200/_clus…...

编程日记 2026/1/21 23:16:20

Redis持久化策略：RDB与AOF详解

目录 1. RDB持久化工作原理触发机制优点缺点配置示例 2. AOF持久化工作原理同步策略重写机制优点缺点配置示例 3. RDB与AOF比较4. 混合持久化(Redis 4.0)5. 选择建议 Redis提供了两种主要的持久化机制来保证数据安全：RDB(Redis Database)和AOF(Append Only File)。本…...

编程日记 2025/9/26 15:33:03