MySQL查询优化:提升数据库性能的策略
在数据库管理和应用中,优化查询是提高MySQL数据库性能的关键环节。随着数据量的不断增长,如何高效地检索和处理数据成为了一个重要的挑战。本文将介绍一系列优化MySQL查询的策略,帮助开发者和管理员提升数据库的性能。
案例1: 使用索引优化查询
假设数据库表结构:
CREATE TABLE employees (id INT AUTO_INCREMENT PRIMARY KEY,name VARCHAR(100),department_id INT,salary DECIMAL(10, 2),hire_date DATE,INDEX idx_department_id (department_id),INDEX idx_salary (salary)
);
原始查询(未使用索引):
SELECT * FROM employees WHERE department_id = 100;
优化后的查询(使用索引):
由于department_id
列上已经有了索引,所以上面的查询已经相对优化。但是,如果查询只需要特定的列,那么应该只选择那些列,而不是使用SELECT *
。
SELECT id, name, salary FROM employees WHERE department_id = 100;
案例2: 避免在WHERE子句中对列使用函数
原始查询(使用函数):
SELECT * FROM employees WHERE YEAR(hire_date) = 2020;
优化后的查询(避免使用函数):
在这个例子中,对hire_date
列使用YEAR()
函数会阻止MySQL使用索引(如果存在的话)。更好的做法是直接比较日期范围。
SELECT * FROM employees WHERE hire_date >= '2020-01-01' AND hire_date < '2021-01-01';
案例3: 优化JOIN查询
假设有两个表:
CREATE TABLE orders (order_id INT AUTO_INCREMENT PRIMARY KEY,customer_id INT,order_date DATE,total_amount DECIMAL(10, 2),INDEX idx_customer_id (customer_id)
);CREATE TABLE customers (customer_id INT AUTO_INCREMENT PRIMARY KEY,name VARCHAR(100),email VARCHAR(100)
);
原始JOIN查询(可能未优化):
SELECT orders.*, customers.name
FROM orders
JOIN customers ON orders.customer_id = customers.customer_id
WHERE customers.email LIKE '%example.com';
优化建议:
- 确保
customer_id
列上有索引(在这个例子中已经有了)。 - 如果
email
列上的搜索模式以通配符开头(如%example.com
),则无法利用索引。如果可能,考虑将搜索模式调整为不以通配符开头,或者使用全文搜索功能(如果MySQL版本支持)。 - 如果经常需要根据
email
域进行搜索,并且搜索模式不总是以通配符开头,那么可以考虑在email
列上创建索引。但是,请注意,这可能会降低插入、更新和删除操作的性能。
案例4: 使用聚合和索引优化GROUP BY查询
原始GROUP BY查询(可能未优化):
SELECT department_id, AVG(salary)
FROM employees
GROUP BY department_id;
优化建议:
- 确保
department_id
列上有索引,因为MySQL在执行GROUP BY时可能会利用它。 - 如果查询经常执行,并且
department_id
和salary
列经常一起使用,那么考虑创建一个覆盖索引,该索引包含这两个列。
-- 假设的覆盖索引创建语句
CREATE INDEX idx_department_salary ON employees(department_id, salary);
请注意,实际的优化效果取决于多个因素,包括数据的大小、分布、MySQL的配置以及查询的具体模式。因此,在执行任何优化之前,最好使用EXPLAIN命令来分析查询的执行计划,并根据实际情况调整策略。
案例5: 使用LIMIT分页优化大数据集查询
原始查询(可能导致性能问题):
SELECT * FROM orders ORDER BY order_date DESC;
如果你尝试在UI中显示这个查询的结果,并且数据集非常大,那么一次性加载所有数据可能会导致性能问题。
优化后的查询(使用LIMIT和OFFSET进行分页):
SELECT * FROM orders ORDER BY order_date DESC LIMIT 10 OFFSET 20;
这个查询会返回从第21条记录开始的10条记录(假设OFFSET从0开始计数,但许多数据库实际上从1开始,这取决于具体的SQL方言)。这样可以有效地管理内存使用,并提高用户体验。
然而,需要注意的是,当OFFSET值非常大时,即使使用了LIMIT,查询性能也可能下降,因为数据库仍然需要扫描或处理OFFSET之前的所有行。在这种情况下,可以考虑使用基于游标的分页或键集分页(Keyset Pagination)来优化性能。
案例6: 优化子查询
原始查询(使用子查询):
SELECT * FROM employees
WHERE department_id IN (SELECT department_id FROM departments WHERE location_id = 10
);
优化建议:
- 确保子查询中的
location_id
列上有索引。 - 如果子查询返回的结果集很小,上述查询通常已经足够优化。但是,如果子查询返回大量数据,那么可以考虑使用JOIN来重写查询,因为JOIN有时能更有效地利用索引。
优化后的查询(使用JOIN):
SELECT e.*
FROM employees e
JOIN departments d ON e.department_id = d.department_id
WHERE d.location_id = 10;
案例7: 优化复杂的JOIN操作
当涉及多个表的JOIN操作时,优化变得尤为重要。以下是一些优化复杂JOIN操作的策略:
- 确保所有JOIN条件上的列都有索引。
- 使用合适的JOIN类型(INNER JOIN、LEFT JOIN、RIGHT JOIN等),根据查询需求选择。
- 考虑JOIN的顺序。MySQL优化器通常会尝试不同的JOIN顺序来找到最有效的执行计划,但有时手动指定JOIN顺序(通过括号或JOIN…USING/ON语句的顺序)可以获得更好的性能。
- 减少JOIN中涉及的行数。通过在JOIN之前使用WHERE子句来过滤掉不必要的行,可以减少JOIN操作需要处理的数据量。
案例8: 使用EXISTS代替IN(在某些情况下)
原始查询(使用IN):
SELECT * FROM employees
WHERE id IN (SELECT manager_id FROM departments);
优化后的查询(使用EXISTS):
SELECT * FROM employees e
WHERE EXISTS (SELECT 1 FROM departments d WHERE d.manager_id = e.id
);
在某些情况下,使用EXISTS代替IN可以提高查询性能,特别是当子查询返回的结果集很大时。EXISTS在找到第一个匹配项时就会停止搜索,而IN可能需要扫描整个子查询结果集。然而,这并不是一个绝对的规则,具体效果取决于数据的实际分布和MySQL的优化器行为。
总结
优化SQL查询是一个复杂的过程,涉及多个方面,包括索引的使用、查询语句的编写、数据库表的设计以及MySQL服务器的配置。通过遵循最佳实践、使用工具(如EXPLAIN)来分析查询计划,并根据实际情况进行调整,可以显著提高数据库的性能。记住,优化是一个持续的过程,需要不断地监控、分析和调整。
相关文章:
MySQL查询优化:提升数据库性能的策略
在数据库管理和应用中,优化查询是提高MySQL数据库性能的关键环节。随着数据量的不断增长,如何高效地检索和处理数据成为了一个重要的挑战。本文将介绍一系列优化MySQL查询的策略,帮助开发者和管理员提升数据库的性能。 案例1: 使用索引优化查…...

vue-快速入门
Vue 前端体系、前后端分离 1、概述 1.1、简介 Vue (发音为 /vjuː/,类似 view) 是一款用于构建用户界面的 JavaScript 框架。它基于标准 HTML、CSS 和 JavaScript 构建,并提供了一套声明式的、组件化的编程模型,可以高效地开发用户界面。…...

【网络流】——初识(最大流)
网络流-最大流 基础信息引入一些概念基本性质 最大流定义 Ford–Fulkerson 增广Edmons−Karp算法Dinic 算法参考文献 基础信息 引入 假定现在有一个无限放水的自来水厂和一个无限收水的小区,他们之间有多条水管和一些节点构成。 每一条水管有三个属性:…...

【STM32嵌入式系统设计与开发---拓展】——1_10矩阵按键
这里写目录标题 1、矩阵按键2、代码片段分析 1、矩阵按键 通过将4x4矩阵按键的每一行依次设为低电平,同时保持其它行为高电平,然后读取所有列的电平状态,可以检测到哪个按键被按下。如果某列变为低电平,说明对应行和列的按键被按下…...
长期更新方法库推荐pmq-ui
# pmq-ui pmq-ui 好用方法库ui库, 欢迎您的使用 ## 安装 1. 克隆项目库到本地: 2. 进入项目目录:cd pmq-ui 3. 安装依赖:npm install pmq-ui ## 使用 <!-- 1. 启动应用: 2. 访问 [http://localhost:3000](http://localhost:300…...

<数据集>抽烟识别数据集<目标检测>
数据集格式:VOCYOLO格式 图片数量:4860张 标注数量(xml文件个数):4860 标注数量(txt文件个数):4860 标注类别数:1 标注类别名称:[smoking] 使用标注工具:labelImg 标注规则:对…...
SQL Server 端口设置教程
引言 你好,我是悦创。 在配置 SQL Server 的过程中,设置正确的端口非常关键,因为它影响到客户端如何连接到 SQL Server 实例。默认情况下,SQL Server 使用 TCP 端口 1433,但在多实例服务器上或出于安全考虑ÿ…...

【React1】React概述、基本使用、脚手架、JSX、组件
文章目录 1. React基础1.1 React 概述1.1.1 什么是React1.1.2 React 的特点声明式基于组件学习一次,随处使用1.2 React 的基本使用1.2.1 React的安装1.2.2 React的使用1.2.3 React常用方法说明React.createElement()ReactDOM.render()1.3 React 脚手架的使用1.3.1 React 脚手架…...
k8s部署kafka集群
k8s部署kafka集群 kafka(Kafka with KRaft) mkdir -p ~/kafka-ymlkubectl create ns kafkacat > ~/kafka-yml/kafka.yml << EOF apiVersion: v1 kind: Service metadata:name: kafka-headlessnamespace: kafkalabels:app: kafka spec:type: C…...
(C++回溯01) 组合
77、组合 回溯题目三步走 1. 确定参数 2. 确定终止条件 3. for 循环横向遍历,递归纵向遍历 class Solution { public:vector<vector<int>> result;vector<int> path;void backtracking(int n, int k, int startIndex) {if(path.size() k) {…...
k8s学习笔记——安装istio的仪表盘之prometheus安装
接上一篇,继续安装istio的dashboard。 先到istio-1.22.0/samples/addons目录下,把yaml文件中的镜像仓库地址修改了,修改地址参考我之前写的CSDN里的镜像对照表。不然直接执行kubectl apply -f samples/addons这个命令后,依据会出…...

四、GD32 MCU 常见外设介绍 (7) 7.I2C 模块介绍
7.1.I2C 基础知识 I2C(Inter-Integrated Circuit)总线是一种由Philips公司开发的两线式串行总线,用于内部IC控制的具有多端控制能力的双线双向串行数据总线系统,能够用于替代标准的并行总线,连接各种集成 电路和功能模块。I2C器件能够减少电…...

Apollo 配置中心的部署与使用经验
前言 Apollo(阿波罗)是携程开源的分布式配置管理中心。 本文主要介绍其基于 Docker-Compose 的部署安装和一些使用的经验 特点 成熟,稳定支持管理多环境/多集群/多命名空间的配置配置修改发布实时(1s)通知到应用程序支…...
Perl中的设计模式革新:命令模式的实现与应用
Perl中的设计模式革新:命令模式的实现与应用 在面向对象编程中,设计模式是解决特定问题的成熟模板。命令模式作为行为设计模式之一,它将请求封装为对象,从而允许用户根据不同的请求对客户进行参数化。本文将深入探讨如何在Perl中…...
Java8-求两个集合取交集
在Java8中,求两个集合的交集可以使用不同的三种方式:传统的循环遍历、使用Stream API的filter操作和使用Stream API的Collection操作。 方法一:传统的循环遍历 首先,我们创建两个集合list1和list2,并给它们添加一些元…...

爬虫学习4:爬取王者荣耀技能信息
爬虫:爬取王者荣耀技能信息(代码和代码流程) 代码 # 王者荣耀英雄信息获取 import time from selenium import webdriver from selenium.webdriver.common.by import By if __name__ __main__:fp open("./honorKing.txt", "…...
在Ubuntu 14.04上安装和使用Memcache的方法
前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 简介 随着您的网站的增长和流量的增加,最快显示压力的组件之一是后端数据库。如果您的数据库没有分布式和配置来处理高负载…...
PCDN技术如何降低运营成本?
PCDN技术通过以下几种方式降低运营商的运营成本: 1.利用用户设备作为缓存节点: PCDN技术将用户设备纳入内容分发网络,利用这些设备的闲置带宽和存储资源来缓存和分发内容。这种方式不需要运营商投入大量的高成本服务器和带宽资源,从而降低了硬件和带宽…...

服务器数据恢复—V7000存储硬盘故障脱机的数据恢复案例
服务器存储数据恢复环境: 某品牌P740小型机AIXSybaseV7000磁盘阵列柜,磁盘阵列柜中有12块SAS机械硬盘(其中包括一块热备盘)。 服务器存储故障: 磁盘阵列柜中有一块磁盘出现故障,运维人员用新硬盘替换掉故障…...

BSV区块链在人工智能时代的数字化转型中的角色
发表时间:2024年6月13日 企业数字化转型已有约30年的历史,而人工智能(以下简称AI)将这种转型提升到了一个全新的高度。这并不难理解,因为AI终于使企业能够发挥其潜力,实现更宏大的目标。然而࿰…...
Cursor实现用excel数据填充word模版的方法
cursor主页:https://www.cursor.com/ 任务目标:把excel格式的数据里的单元格,按照某一个固定模版填充到word中 文章目录 注意事项逐步生成程序1. 确定格式2. 调试程序 注意事项 直接给一个excel文件和最终呈现的word文件的示例,…...
ubuntu搭建nfs服务centos挂载访问
在Ubuntu上设置NFS服务器 在Ubuntu上,你可以使用apt包管理器来安装NFS服务器。打开终端并运行: sudo apt update sudo apt install nfs-kernel-server创建共享目录 创建一个目录用于共享,例如/shared: sudo mkdir /shared sud…...

Appium+python自动化(十六)- ADB命令
简介 Android 调试桥(adb)是多种用途的工具,该工具可以帮助你你管理设备或模拟器 的状态。 adb ( Android Debug Bridge)是一个通用命令行工具,其允许您与模拟器实例或连接的 Android 设备进行通信。它可为各种设备操作提供便利,如安装和调试…...
基础测试工具使用经验
背景 vtune,perf, nsight system等基础测试工具,都是用过的,但是没有记录,都逐渐忘了。所以写这篇博客总结记录一下,只要以后发现新的用法,就记得来编辑补充一下 perf 比较基础的用法: 先改这…...

ESP32 I2S音频总线学习笔记(四): INMP441采集音频并实时播放
简介 前面两期文章我们介绍了I2S的读取和写入,一个是通过INMP441麦克风模块采集音频,一个是通过PCM5102A模块播放音频,那如果我们将两者结合起来,将麦克风采集到的音频通过PCM5102A播放,是不是就可以做一个扩音器了呢…...
linux 下常用变更-8
1、删除普通用户 查询用户初始UID和GIDls -l /home/ ###家目录中查看UID cat /etc/group ###此文件查看GID删除用户1.编辑文件 /etc/passwd 找到对应的行,YW343:x:0:0::/home/YW343:/bin/bash 2.将标红的位置修改为用户对应初始UID和GID: YW3…...
拉力测试cuda pytorch 把 4070显卡拉满
import torch import timedef stress_test_gpu(matrix_size16384, duration300):"""对GPU进行压力测试,通过持续的矩阵乘法来最大化GPU利用率参数:matrix_size: 矩阵维度大小,增大可提高计算复杂度duration: 测试持续时间(秒&…...
数据库分批入库
今天在工作中,遇到一个问题,就是分批查询的时候,由于批次过大导致出现了一些问题,一下是问题描述和解决方案: 示例: // 假设已有数据列表 dataList 和 PreparedStatement pstmt int batchSize 1000; // …...
浅谈不同二分算法的查找情况
二分算法原理比较简单,但是实际的算法模板却有很多,这一切都源于二分查找问题中的复杂情况和二分算法的边界处理,以下是博主对一些二分算法查找的情况分析。 需要说明的是,以下二分算法都是基于有序序列为升序有序的情况…...

人工智能(大型语言模型 LLMs)对不同学科的影响以及由此产生的新学习方式
今天是关于AI如何在教学中增强学生的学习体验,我把重要信息标红了。人文学科的价值被低估了 ⬇️ 转型与必要性 人工智能正在深刻地改变教育,这并非炒作,而是已经发生的巨大变革。教育机构和教育者不能忽视它,试图简单地禁止学生使…...