怎样对 PostgreSQL 中的慢查询进行分析和优化?
- 🍅关注博主🎗️ 带你畅游技术世界,不错过每一次成长机会!
- 📚领书:PostgreSQL 入门到精通.pdf
文章目录
- 怎样对 PostgreSQL 中的慢查询进行分析和优化?
- 一、理解慢查询的危害
- 二、找出慢查询
- (一)日志分析
- (二)使用扩展工具
- 三、分析慢查询
- (一)查看执行计划
- (二)分析索引使用情况
- (三)检查数据分布和表结构
- 四、优化慢查询
- (一)创建合适的索引
- (二)优化查询语句
- (三)调整数据库参数
- (四)分表和分区
- 五、优化过程中的注意事项
- (一)不要过度优化
- (二)测试和验证
- (三)持续监控
- 六、总结
怎样对 PostgreSQL 中的慢查询进行分析和优化?
在数据库的世界里,慢查询就像是路上的绊脚石,让数据处理的道路变得崎岖不平。想象一下,你正在高速公路上飞驰,突然遇到一堆减速带,那感觉肯定糟透了。对于使用 PostgreSQL 的开发者和管理员来说,学会分析和优化慢查询就是清除这些“减速带”,让数据的“跑车”能够风驰电掣。
一、理解慢查询的危害
在深入探讨如何分析和优化慢查询之前,咱们先来唠唠慢查询到底能带来哪些麻烦。打个比方,假如你经营着一家网店,每当顾客下单时,系统都要慢悠悠地处理订单信息,这不仅会让顾客等得不耐烦,甚至可能直接走人,去别家下单。同样的道理,在数据库中,如果查询响应时间过长,会严重影响应用程序的性能和用户体验。
从技术角度来看,慢查询会占用大量的系统资源,比如 CPU、内存和 I/O 带宽。这就好比一群人同时挤在一个狭窄的门口,谁也过不去,导致整个系统的运行效率低下。而且,频繁出现的慢查询还可能引发连锁反应,导致其他正常的查询也受到牵连,就像多米诺骨牌一样,一倒一大片。
二、找出慢查询
要想解决问题,首先得把问题找出来。在 PostgreSQL 中,我们可以通过多种方式来发现慢查询。
(一)日志分析
PostgreSQL 的日志就像是一个“记事本”,记录了数据库运行过程中的点点滴滴。我们可以通过配置日志参数,让它记录查询的执行时间。通常,我们可以设置一个阈值,比如超过 500 毫秒的查询就被认为是慢查询,并将其记录到日志中。
log_min_duration_statement = 500
这样,在日志中,我们就能找到那些执行时间超过设定阈值的查询语句,就像在一堆沙子中找出那些大颗粒的石头一样。
(二)使用扩展工具
除了依靠原生的日志功能,还可以借助一些扩展工具来找出慢查询。比如说 pg_stat_statements
这个扩展,它可以收集查询的执行统计信息,包括执行次数、平均执行时间、最大执行时间等等。
启用这个扩展后,我们可以通过查询相关的视图来获取慢查询的信息:
SELECT query, calls, total_time, mean_time
FROM pg_stat_statements
ORDER BY total_time DESC;
这就好比有了一个“侦探”,帮我们在数据库的“大街小巷”里寻找那些行动迟缓的“嫌疑人”。
三、分析慢查询
找到了慢查询,接下来就得像侦探破案一样,仔细分析找出问题的根源。
(一)查看执行计划
PostgreSQL 提供了一个强大的工具——执行计划(Execution Plan),它就像是一张地图,告诉我们查询语句在数据库内部是如何执行的。
我们可以使用 EXPLAIN
命令来获取查询的执行计划:
EXPLAIN SELECT * FROM your_table WHERE some_column = 'value';
执行计划中包含了很多有用的信息,比如表的扫描方式(顺序扫描还是索引扫描)、连接方式(嵌套循环连接、哈希连接还是合并连接)、预估的行数等等。
比如说,如果看到执行计划中使用了全表顺序扫描,而表中的数据量又很大,那这很可能就是导致查询慢的一个原因。因为顺序扫描就像是在一个没有目录的大图书馆里一本一本找书,效率可想而知。
(二)分析索引使用情况
索引就像是数据库的“指南针”,能帮助快速定位数据。如果查询没有使用到合适的索引,或者根本就没有索引,那查询速度肯定快不了。
我们可以通过执行计划来查看索引的使用情况。如果在执行计划中没有看到 Index Scan
,而是看到了 Seq Scan
,那就得考虑是不是缺少必要的索引,或者查询条件不适合现有的索引。
举个例子,如果有一个表 users
,其中有一个列 age
经常用于查询,但是没有为 age
列创建索引,那么当执行 SELECT * FROM users WHERE age = 25;
这样的查询时,就很可能会进行全表扫描,导致查询变慢。
(三)检查数据分布和表结构
有时候,慢查询的问题可能不在查询语句本身,而是数据的分布或者表结构不合理。
比如说,如果一个表中的数据严重倾斜,某些值出现的频率特别高,这可能会影响索引的效果。再比如,表的字段类型选择不当,导致存储空间浪费或者查询处理复杂,也会拖慢查询速度。
就好比你把所有的东西都胡乱塞进一个箱子里,找起来肯定费劲。同样,如果表结构设计得乱七八糟,数据存储没有条理,查询的时候自然也就磕磕绊绊。
四、优化慢查询
找到了问题的症结,接下来就是对症下药,对慢查询进行优化。
(一)创建合适的索引
正如前面所说,索引是提高查询速度的关键。但是,也不能盲目地创建索引,过多的索引会增加数据插入、更新和删除的开销。
创建索引时,要根据查询的频繁程度和条件来选择合适的列。一般来说,经常用于查询、连接、排序和分组的列适合创建索引。
例如,如果经常执行 SELECT * FROM orders WHERE order_id = 123;
这样的查询,那么为 order_id
列创建索引是一个不错的选择。
CREATE INDEX idx_orders_order_id ON orders (order_id);
(二)优化查询语句
有时候,只需要对查询语句进行一些小小的调整,就能带来显著的性能提升。
比如,避免使用 SELECT *
,而是明确指定需要的列。这样可以减少数据的传输量,提高查询效率。
再比如,合理使用连接(JOIN),避免不必要的子查询。子查询就像是在一个大任务中嵌套了一个小任务,增加了复杂性和执行时间。
举个例子,原本的查询是:
SELECT * FROM users WHERE age = (SELECT AVG(age) FROM users);
可以优化为:
SELECT u.* FROM users u JOIN (SELECT AVG(age) AS avg_age FROM users) a ON u.age = a.avg_age;
(三)调整数据库参数
PostgreSQL 有很多可以调整的参数,比如共享缓冲区大小、工作内存等等。根据服务器的硬件资源和负载情况,合理调整这些参数,可以提高数据库的整体性能。
但这就像是给汽车调整发动机参数一样,需要谨慎操作,否则可能会适得其反。
(四)分表和分区
当一个表的数据量非常大时,可以考虑分表或者分区。分表就是将一个大表拆分成多个小表,分区则是将表的数据按照一定的规则划分到不同的分区中。
比如说,如果有一个订单表,数据量已经达到了数百万条,我们可以按照年份或者月份对其进行分区,这样在查询特定时间段的数据时,只需要扫描相应的分区,而不是整个表。
这就好比把一个大仓库分成若干个小仓库,找东西的时候目标更明确,速度自然就快了。
五、优化过程中的注意事项
在优化慢查询的过程中,有几个“坑”需要特别注意。
(一)不要过度优化
俗话说,过犹不及。有时候,为了追求极致的性能,可能会进行一些复杂的优化操作,但这可能会导致代码的可读性和可维护性下降。而且,在实际应用中,可能并不需要那么高的性能。
所以,要根据实际情况,权衡优化的成本和收益,不要为了一点点性能提升而付出巨大的代价。
(二)测试和验证
在对查询进行优化后,一定要进行充分的测试和验证,确保优化没有引入新的问题。比如,优化后的查询在某些特殊情况下是否能正常工作,数据的准确性是否受到影响等等。
就像修好了一辆车,得开出去跑一圈,看看有没有其他毛病。
(三)持续监控
数据库的性能不是一成不变的,随着数据量的增长、业务的变化,可能会出现新的慢查询。所以,要持续监控数据库的性能,及时发现并解决问题。
这就像是定期给汽车做保养,才能保证它一直处于良好的运行状态。
六、总结
对 PostgreSQL 中的慢查询进行分析和优化是一项需要耐心和技巧的工作。就像一场马拉松,不能急于求成,要一步一个脚印,从发现问题、分析问题到解决问题,每个环节都要认真对待。
🎉相关推荐
- 🍅关注博主🎗️ 带你畅游技术世界,不错过每一次成长机会!
- 📚领书:PostgreSQL 入门到精通.pdf
- 📙PostgreSQL 中文手册
- 📘PostgreSQL 技术专栏
- 🍅CSDN社区-墨松科技
相关文章:

怎样对 PostgreSQL 中的慢查询进行分析和优化?
🍅关注博主🎗️ 带你畅游技术世界,不错过每一次成长机会!📚领书:PostgreSQL 入门到精通.pdf 文章目录 怎样对 PostgreSQL 中的慢查询进行分析和优化?一、理解慢查询的危害二、找出慢查询&#x…...

Springboot项目远程部署gitee仓库(docker+Jenkins+maven+git)
创建一个Springboot项目,勾选web将该项目创建git本地仓库,再创建远程仓库推送上去 创建TestController RestController RequestMapping("/test") public class TestController { GetMapping("/hello") public String sayHelloJe…...

Chromium CI/CD 之Jenkins实用指南2024- Windows节点开启SSH服务(七)
1.引言 在现代软件开发和持续集成的过程中,自动化部署和远程管理是不可或缺的关键环节。SSH(Secure Shell)协议以其强大的安全性和灵活性,成为连接和管理远程服务器的首选工具。对于使用Windows虚拟机作为Jenkins从节点的开发者而…...
阿里大数据面试题集锦及参考答案(3万字长文:持续更新)
目录 MapReduce Shuffle为什么要将数据写入环形缓冲区 MapReduce Shuffle为什么容易发生数据倾斜 Hadoop HA当一个Namenode挂掉,会有数据丢失吗 数据倾斜发生的位置 Combiner了解吗? 什么情况下不能用Combiner? Sum、Count、Count(distinct)哪些能用、哪些不能用Comb…...

springboot 配置 spring data redis
1、在pom.xml引入父依赖spring-boot-starter-parent,其中2.7.18是最后一版支持java8的spring <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>2.7.18</…...
Numpy基础用法
Numpy基础用法 numpy.all()num.sun() numpy.all() numpy 中的 all() 函数用于测试 NumPy 数组中所有元素是否都满足指定条件。它接受一个 NumPy 数组作为输入,并返回一个布尔值,指示数组中所有元素是否都满足条件。让我们通过具体的代码示例来深入探讨 n…...
设计模式--享元模式
享元模式(Flyweight Pattern)是一种结构型设计模式,它通过共享大量细粒度的对象来减少内存消耗。这个模式的核心思想是把对象的状态分为内在状态和外在状态,其中内在状态是可以共享的,而外在状态是需要独立维护的。 享…...

可视化剪辑,账号矩阵,视频分发,聚合私信一体化营销工具 源----代码开发部署方案
可视化剪辑: 为了实现可视化剪辑功能,可以使用流行的视频编辑软件或者开发自己的视频编辑工具。其中,通过设计用户友好的界面,用户可以简单地拖拽和放大缩小视频片段,剪辑出满足需求的视频。在开发过程中,可…...
CCF-CSP认证考试 202406-2 矩阵重塑(其二) 100分题解
更多 CSP 认证考试题目题解可以前往:CSP-CCF 认证考试真题题解 原题链接: 202406-2 矩阵重塑(其二) 时间限制: 1.0 秒 空间限制: 512 MiB 题目背景 矩阵转置操作是将矩阵的行和列交换的过程。在转置过程…...

初阶数据结构的实现1 顺序表和链表
顺序表和链表 1.线性表1.1顺序表1.1.1静态顺序表(不去实现)1.1.2动态顺序表1.1.2.1 定义程序目标1.1.2.2 设计程序1.1.2.3编写代码1.1.2.3测试和调试代码 1.1.2 顺序表的问题与思考 1.2链表1.2.1链表的概念及结构1.2.1.1 定义程序目标1.2.1.2 设计程序1.…...

破解反爬虫策略 /_guard/auto.js(一) 原理
背景 当用代码或者postman访问一个网站的时候,访问他的任何地址都会返回<script src"/_guard/auto.js"></script>,但是从浏览器中访问显示的页面是正常的,这种就是网站做了反爬虫策略。本文就是带大家来破解这种策略&…...

40.简易频率计(基于等精度测量法)(3)
(1)BCD8421码:十进制数字转换成BCD8421码的方法 补零:你需要显示多少位数字,就在前面补上四倍的位宽。比如你要显示一个十进制8位的数字,就在前面补上8*432个零。判断:判断补零部分显示的十进制…...

关于Centos停更yum无法使用的解决方案
最近在使用Centos7.9系统时候,发现yum仓库无法进行安装软件包了,官方说2024年6月30日进行停更,停更后无法提供对应的软件服务。 我在使用yum安装包的时候发现确实不能使用官方服务了: CentOS停更的影响 CentOS停止更新之后&#…...

插画感言:成都亚恒丰创教育科技有限公司
插画感言:笔触间的灵魂对话 在这个快节奏、高压力的时代,我们时常在寻找那些能够触动心灵、让灵魂得以片刻栖息的角落。而插画,这一融合了艺术与情感的独特形式,便如同一股清泉,缓缓流淌进每个人的心田,以…...
【算法】数组中的第K个最大元素
难度:中等 题目: 给定整数数组 nums 和整数 k,请返回数组中第 k 个最大的元素。 请注意,你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素。 你必须设计并实现时间复杂度为 O(n) 的算法解决此问题…...
Perl 语言的特点
Perl 语言入门学习可以涵盖多个方面,包括其特点、基本语法、高级特性以及学习资源和社区支持等。以下是一个详细的入门学习指南: 一、Perl 语言的特点 文本处理能力强:Perl 提供了丰富的字符串处理函数和正则表达式的支持,非常适…...

NLP教程:1 词袋模型和TFIDF模型
文章目录 词袋模型TF-IDF模型词汇表模型 词袋模型 文本特征提取有两个非常重要的模型: 词集模型:单词构成的集合,集合自然每个元素都只有一个,也即词集中的每个单词都只有一个。 词袋模型:在词集的基础上如果一个单词…...

【开源 Mac 工具推荐之 2】洛雪音乐(lx-music-desktop):免费良心的音乐平台
旧版文章:【macOS免费软件推荐】第6期:洛雪音乐 Note:本文在旧版文章的基础上,新更新展示了一些洛雪音乐的新功能,并且描述更为详细。 简介 洛雪音乐(GitHub 名:lx-music-desktop )…...

AMEYA360:思瑞浦推出汽车级理想二极管ORing控制器TPS65R01Q
聚焦高性能模拟芯片和嵌入式处理器的半导体供应商思瑞浦3PEAK(股票代码:688536)发布汽车级理想二极管ORing控制器TPS65R01Q。 TPS65R01Q拥有20mV正向调节功能,降低系统损耗。快速反向关断(Typ:0.39μs),在电池反向和各种汽车电气瞬…...

简约的悬浮动态特效404单页源HTML码
源码介绍 简约的悬浮动态特效404单页源HTML码,页面简约美观,可以做网站错误页或者丢失页面,将下面的代码放到空白的HTML里面,然后上传到服务器里面,设置好重定向即可 效果预览 完整源码 <!DOCTYPE html> <html><head><meta charset="utf-8&q…...
Spring Boot 实现流式响应(兼容 2.7.x)
在实际开发中,我们可能会遇到一些流式数据处理的场景,比如接收来自上游接口的 Server-Sent Events(SSE) 或 流式 JSON 内容,并将其原样中转给前端页面或客户端。这种情况下,传统的 RestTemplate 缓存机制会…...
Oracle查询表空间大小
1 查询数据库中所有的表空间以及表空间所占空间的大小 SELECTtablespace_name,sum( bytes ) / 1024 / 1024 FROMdba_data_files GROUP BYtablespace_name; 2 Oracle查询表空间大小及每个表所占空间的大小 SELECTtablespace_name,file_id,file_name,round( bytes / ( 1024 …...
QMC5883L的驱动
简介 本篇文章的代码已经上传到了github上面,开源代码 作为一个电子罗盘模块,我们可以通过I2C从中获取偏航角yaw,相对于六轴陀螺仪的yaw,qmc5883l几乎不会零飘并且成本较低。 参考资料 QMC5883L磁场传感器驱动 QMC5883L磁力计…...

家政维修平台实战20:权限设计
目录 1 获取工人信息2 搭建工人入口3 权限判断总结 目前我们已经搭建好了基础的用户体系,主要是分成几个表,用户表我们是记录用户的基础信息,包括手机、昵称、头像。而工人和员工各有各的表。那么就有一个问题,不同的角色…...
vue3 字体颜色设置的多种方式
在Vue 3中设置字体颜色可以通过多种方式实现,这取决于你是想在组件内部直接设置,还是在CSS/SCSS/LESS等样式文件中定义。以下是几种常见的方法: 1. 内联样式 你可以直接在模板中使用style绑定来设置字体颜色。 <template><div :s…...

cf2117E
原题链接:https://codeforces.com/contest/2117/problem/E 题目背景: 给定两个数组a,b,可以执行多次以下操作:选择 i (1 < i < n - 1),并设置 或,也可以在执行上述操作前执行一次删除任意 和 。求…...
Robots.txt 文件
什么是robots.txt? robots.txt 是一个位于网站根目录下的文本文件(如:https://example.com/robots.txt),它用于指导网络爬虫(如搜索引擎的蜘蛛程序)如何抓取该网站的内容。这个文件遵循 Robots…...

AI书签管理工具开发全记录(十九):嵌入资源处理
1.前言 📝 在上一篇文章中,我们完成了书签的导入导出功能。本篇文章我们研究如何处理嵌入资源,方便后续将资源打包到一个可执行文件中。 2.embed介绍 🎯 Go 1.16 引入了革命性的 embed 包,彻底改变了静态资源管理的…...
稳定币的深度剖析与展望
一、引言 在当今数字化浪潮席卷全球的时代,加密货币作为一种新兴的金融现象,正以前所未有的速度改变着我们对传统货币和金融体系的认知。然而,加密货币市场的高度波动性却成为了其广泛应用和普及的一大障碍。在这样的背景下,稳定…...

springboot整合VUE之在线教育管理系统简介
可以学习到的技能 学会常用技术栈的使用 独立开发项目 学会前端的开发流程 学会后端的开发流程 学会数据库的设计 学会前后端接口调用方式 学会多模块之间的关联 学会数据的处理 适用人群 在校学生,小白用户,想学习知识的 有点基础,想要通过项…...