SQL进阶知识:四、索引优化
今天介绍下关于索引优化的详细介绍,并结合MySQL数据库提供实际例子。
索引优化是数据库性能优化的关键环节之一,尤其是在处理大量数据时。索引可以加快查询速度,减少数据扫描范围,但不当的索引设计也可能导致性能问题。以下是关于索引优化的详细介绍,以及基于MySQL的实际例子。
一、索引的基本概念
1. 索引的作用
索引类似于书籍的目录,它可以帮助数据库快速定位到需要的数据,而无需扫描整个表。索引可以显著提高查询效率,尤其是在大数据量的情况下。
2. 索引的类型
MySQL支持多种类型的索引:
- 普通索引(Normal Index):最基本的索引类型,没有唯一性限制。
- 唯一索引(Unique Index):索引列的值必须唯一,但允许有
NULL
值。 - 主键索引(Primary Key Index):特殊的唯一索引,表中只能有一个主键索引,且主键列不允许有
NULL
值。 - 全文索引(Full-Text Index):用于全文搜索,支持对文本数据的快速搜索。
- 组合索引(Composite Index):在多个列上创建索引,用于优化多列查询。
3. 索引的存储结构
MySQL通常使用**B树(B-Tree)**作为索引的存储结构。B树索引适用于范围查询和等值查询。
二、索引优化的关键点
1. 选择合适的列创建索引
- 高选择性(High Selectivity):选择性高的列(即列中值的重复度低)更适合创建索引。例如,
id
列通常比gender
列更适合创建索引。 - 查询频率高:优先为经常出现在
WHERE
子句、JOIN
条件或ORDER BY
子句中的列创建索引。
2. 避免过度索引
- 索引的维护成本:索引会占用额外的存储空间,并且在插入、更新和删除数据时需要额外的维护成本。
- 选择性低的列:对于选择性低的列(如性别、状态等),创建索引可能不会带来显著的性能提升。
3. 使用组合索引
- 最左前缀原则:组合索引的查询条件必须从索引的最左列开始,否则索引可能不会被使用。
- 覆盖索引:如果查询的所有列都在索引中,MySQL可以直接从索引中获取数据,而无需访问表。
4. 避免在索引列上使用函数
在索引列上使用函数会导致索引失效。例如:
-- 不推荐:会导致索引失效
SELECT * FROM users WHERE YEAR(birthdate) = 1990;-- 推荐:避免在索引列上使用函数
SELECT * FROM users WHERE birthdate BETWEEN '1990-01-01' AND '1990-12-31';
5. 定期维护索引
- 重建索引:在大量数据更新后,索引可能会变得碎片化,影响性能。可以通过
ALTER TABLE
或OPTIMIZE TABLE
重建索引。 - 删除无用索引:定期检查索引的使用情况,删除那些从未被使用的索引。
三、实际例子
示例1:优化单列索引
假设有一个users
表,记录用户的个人信息:
CREATE TABLE users (id INT PRIMARY KEY AUTO_INCREMENT,name VARCHAR(100),email VARCHAR(100),birthdate DATE,created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP
);
场景:优化查询用户邮箱的查询
-- 创建索引
CREATE INDEX idx_email ON users(email);-- 查询用户邮箱
SELECT * FROM users WHERE email = 'example@example.com';
解释:
- 创建了一个普通索引
idx_email
,用于优化基于email
列的查询。 - 查询时,MySQL会使用索引快速定位到匹配的行,而无需扫描整个表。
示例2:优化组合索引
假设需要根据用户的birthdate
和created_at
进行查询。
场景:优化基于birthdate
和created_at
的查询
-- 创建组合索引
CREATE INDEX idx_birthdate_created_at ON users(birthdate, created_at);-- 查询用户
SELECT * FROM users WHERE birthdate = '1990-01-01' AND created_at >= '2023-01-01';
解释:
- 创建了一个组合索引
idx_birthdate_created_at
,包含birthdate
和created_at
两列。 - 查询时,MySQL会使用组合索引快速定位到匹配的行。
- 注意:查询条件必须从索引的最左列开始,否则索引可能不会被使用。
示例3:优化覆盖索引
假设需要查询用户的id
和name
,并且这两个字段经常一起查询。
场景:优化查询用户id
和name
-- 创建覆盖索引
CREATE INDEX idx_id_name ON users(id, name);-- 查询用户
SELECT id, name FROM users WHERE id = 1;
解释:
- 创建了一个组合索引
idx_id_name
,包含id
和name
两列。 - 查询时,MySQL可以直接从索引中获取
id
和name
,而无需访问表,从而提高查询效率。
示例4:避免在索引列上使用函数
假设需要查询用户的出生年份。
场景:优化查询用户出生年份
-- 查询用户出生年份(不推荐)
SELECT * FROM users WHERE YEAR(birthdate) = 1990;-- 查询用户出生年份(推荐)
SELECT * FROM users WHERE birthdate BETWEEN '1990-01-01' AND '1990-12-31';
解释:
- 第一个查询中,
YEAR(birthdate)
会导致索引失效,MySQL需要扫描整个表。 - 第二个查询中,使用
BETWEEN
避免了函数,MySQL可以利用索引快速定位到匹配的行。
示例5:定期维护索引
假设表中有大量数据更新,需要重建索引以优化性能。
场景:重建索引
-- 重建索引
ALTER TABLE users DROP INDEX idx_email;
ALTER TABLE users ADD INDEX idx_email (email);-- 或者使用OPTIMIZE TABLE
OPTIMIZE TABLE users;
解释:
- 使用
ALTER TABLE
删除并重新创建索引,可以优化索引的存储结构。 - 使用
OPTIMIZE TABLE
可以清理表中的碎片,优化表和索引的存储。
四、总结
索引优化是提高数据库性能的重要手段。通过合理选择索引列、使用组合索引、避免在索引列上使用函数以及定期维护索引,可以显著提升查询效率。然而,索引的创建和维护也需要谨慎,避免过度索引导致的性能问题。
以上就是基于Mysql,有关查询相关的进阶知识,希望对你有所帮助~
后续会连续发布多篇SQL进阶相关内容;
期待你的关注,学习更多知识;
相关文章:
SQL进阶知识:四、索引优化
今天介绍下关于索引优化的详细介绍,并结合MySQL数据库提供实际例子。 索引优化是数据库性能优化的关键环节之一,尤其是在处理大量数据时。索引可以加快查询速度,减少数据扫描范围,但不当的索引设计也可能导致性能问题。以下是关于…...
【Leetcode 每日一题】2799. 统计完全子数组的数目
问题背景 给你一个由 正 整数组成的数组 n u m s nums nums。 如果数组中的某个子数组满足下述条件,则称之为 完全子数组 : 子数组中 不同 元素的数目等于整个数组不同元素的数目。 返回数组中 完全子数组 的数目。 子数组 是数组中的一个连续非空序…...
OpenCV中的SIFT特征提取
文章目录 引言一、SIFT算法概述二、OpenCV中的SIFT实现2.1 基本使用2.1.1 导入库2.1.2 图片预处理2.1.3 创建SIFT检测器2.1.4 检测关键点并计算描述符2.1.5 检测关键点并计算描述符并对关键点可视化2.1.6 印关键点和描述符的形状信息 2.2 参数调优 三、SIFT的优缺点分析3.1 优点…...

【金仓数据库征文】-《深入探索金仓数据库:从基础到实战》
目录 前言 什么是金仓数据库? 金仓数据库的特点 金仓数据库的核心特点 金仓数据库与其他数据库的对比 金仓数据库的安装 常见的语句 总结 前言 为助力开发者、运维人员及技术爱好者快速掌握这一工具,本文将系统性地介绍金仓数据库的核心知识。内…...

RocketMQ 主题与队列的协同作用解析(既然队列存储在不同的集群中,那要主题有什么用呢?)---管理命令、配置安装
学习之前呢需要会使用linux的基础命令 一.RocketMQ 主题与队列的协同作用解析 在 RocketMQ 中,主题(Topic)与队列(Queue)的协同设计实现了消息系统的逻辑抽象与物理存储分离。虽然队列实际存储在不同集群的 B…...

从岗位依附到能力生态:AI革命下“什么叫就业”的重构与价值
在人工智能(AI)技术深刻重塑社会生产关系的当下,“就业”这一概念正经历着从“职业绑定”到“能力变现”的范式转移。本文将从传统就业观的解构、AI赋能艺术教育的价值逻辑、以及未来就业形态的进化方向三个维度,探讨技术驱动下就业的本质变革,并揭示AI技术如何通过教育创…...
leetcode_二叉树 230. 二叉搜索树中第 K 小的元素
230. 二叉搜索树中第 K 小的元素 给定一个二叉搜索树的根节点 root ,和一个整数 k ,请你设计一个算法查找其中第 k 小的元素(从 1 开始计数)。 示例 1: 输入:root [3,1,4,null,2], k 1输出:1…...

海外版高端Apple科技汽车共享投资理财系统
这一款PHP海外版高端Apple、科技汽车、共享投资理财系统phplaravel框架。...
架构-软件架构设计
一、软件架构基础概念 1. 软件架构的定义 通俗理解:软件架构是软件系统的“骨架”,定义了系统的结构、行为和属性,就像盖房子的设计图纸,规划了房间布局、承重结构和功能分区。核心作用: 沟通桥梁:让技术…...

企业为何要禁止“片断引用开源软件代码”?一文看透!
开篇故事:一段“开源代码”引发的百亿级灾难 某电商平台为快速上线新功能,从GitHub复制了一段“高性能加密算法”代码到支付系统中。 半年后,黑客通过该代码中的隐藏后门,盗取百万用户信用卡信息。 事后调查:这段代…...
yolo常用操作(长话短说)热力图,特征图,结构图,训练,测试,预测
训练 from ultralytics import YOLOmodel YOLO(ryolo11n.yaml) # 改为模型文件名model.load(yolo11n.pt) # 权重文件名,官网下载results model.train(datarfish.yaml, # 数据yaml文件epochs300,batch8,device0,workers0,workspace4) yaml文件不会搞的࿰…...

【C++指南】告别C字符串陷阱:如何实现封装string?
🌟 各位看官好,我是egoist2023! 🌍 种一棵树最好是十年前,其次是现在! 💬 注意:本章节只详讲string中常用接口及实现,有其他需求查阅文档介绍。 🚀 今天通过了…...

国内ip地址怎么改?详细教程
在中国,更改IP地址需要遵守规则,并确保所有操作合规。在特定情况下,可能需要修改IP地址以满足不同需求或解决特定问题。以下是一些常见且合法的IP地址变更方法及注意事项: 一、理解IP地址 IP地址是设备在网络中的唯一标识&#x…...

模式设计简介
设计模式简介 设计模式是软件开发中经过验证的最佳实践解决方案,它是针对特定问题的通用解决方案,能够帮助开发者提升代码的可维护性、可扩展性和复用性。设计模式并非具体的代码实现,而是一种解决问题的思路和方法论,它源于大量的实践经验总结,旨在解决软件开发过程中反…...

众趣科技X世界读书日丨数字孪生技术赋能图书馆空间智慧化运营
4月23日,是第30个“世界读书日”,不仅是庆祝阅读的日子,更是思考知识传播未来的契机。 图书馆作为主要传播图书的场所,在科技的发展中,图书馆正面临前所未有的挑战,联合国数据显示,全球近30%的…...

MySQL 事务(详细版)
目录 一、事务简介 1、事务的概念 2、事务执行的案例 3、对于事务的理解 二、事务操作 (一)未控制事务 (二)控制事务一 (三)控制事务二 三、事务四大特性 四、并发事务问题 五、事务隔离…...

c++之网络编程
网络编程:使得计算机程序能够在网络中发送和接受数据,从而实现分布式系统和网络服务的功能。 作用:使应用程序能够通过网络协议与其他计算机程序进行数据交换 基本概念 套接字(socket): 套接字是网络通信…...
支付场景下,乐观锁的实现(简洁版)
1、问题描述 看到一个同事建的数据库表,好奇打开看看。 create table db_paycenter.t_pay_order_divide (id bigint auto_increment comment 主键id|20250402|XXXprimary key,user_id bigint not null comment user…...

MySQL8的安装方法
概述: MySQL对于开发人员来说,并不陌生。但是很多朋友提起安装MySQL就很头疼,如果一不小心安装失败,再现安装第二遍就变得更加头疼。今天给大家分享一个比较非常简单好安装的方法,并且删除或者卸载也都非常容易 下载…...

CF每日4题
1500左右的做到还是有点吃力 2093E 1500 二分答案 题意:给定一个长度为 n 的数组,现在要把它切成 k 份,求每一份最小的MEX中的最大值。 就是找最大值,但是这个值是所有段最小的值采用二分答案,二分这个值࿰…...

基于 Spring Boot 瑞吉外卖系统开发(七)
基于 Spring Boot 瑞吉外卖系统开发(七) 新增菜品页面 菜品管理页面提供了一个“新增菜品”按钮,单击该按钮时,会打开新增菜品页面。 菜品分类列表 首先要获取分类列表数据。 请求路径/category/list,请求方法GE…...

二项式分布html实验
二项式分布html实验 本文将带你一步步搭建一个纯前端的二项分布 Monte-Carlo 模拟器。 只要一个 HTML 文件,打开就能运行: 动态输入试验次数 n、成功概率 p 与重复次数 m点击按钮立刻得到「模拟频数 vs 理论频数」柱状图随着 m 增大,两组柱状…...
什么是非关系型数据库
什么是非关系型数据库? 引言 随着互联网应用的快速发展,传统的基于表格的关系型数据库(如 MySQL、Oracle 等)已经不能完全满足现代应用程序的需求。在这种背景下,非关系型数据库(NoSQL 数据库)…...

java配置
环境变量...
MySQL性能常用优化技巧总结
1. 索引优化 创建合适的索引 -- 为常用查询条件创建索引 ALTER TABLE users ADD INDEX idx_email (email); ALTER TABLE orders ADD INDEX idx_customer_date (customer_id, order_date);避免索引失效的情况 -- 避免在索引列上使用函数 SELECT * FROM users WHERE DATE(crea…...

大模型如何作为reranker?
大模型如何作为reranker? 作者:爱工作的小小酥 原文地址:https://zhuanlan.zhihu.com/p/31805674335 只为了感动自己而去做一些事情纯属浪费时间。 ————爱工作的小小酥 引言 用于检索的模型中,我们最熟悉的就是单塔和双塔了&…...

发放优惠券
文章目录 概要整体架构流程技术细节小结 概要 发放优惠券 处于暂停状态,或者待发放状态的优惠券,在优惠券列表中才会出现发放按钮,可以被发放: 需求分析以及接口设计 需要我们选择发放方式,使用期限。 发放方式分…...
Java大师成长计划之第3天:Java中的异常处理机制
📢 友情提示: 本文由银河易创AI(https://ai.eaigx.com)平台gpt-4o-mini模型辅助创作完成,旨在提供灵感参考与技术分享,文中关键数据、代码与结论建议通过官方渠道验证。 在 Java 编程中,异常处理…...

试完5个AI海报工具后,我投了秒出设计一票!
随着AI技术的不断发展,越来越多的AI生成工具进入了设计领域,海报生成工具成为了其中的重要一员。今天,我们将为大家介绍三款热门的AI海报生成工具,并进行对比分析,帮助大家选择最适合的工具。 1. 秒出设计:…...
SD2351核心板:重构AI视觉产业价值链的“超级节点”
在AI视觉技术狂飙突进的当下,一个吊诡的现象正在浮现:一方面,学术界不断刷新着ImageNet等基准测试的精度纪录;另一方面,产业界却深陷“算法有、场景无,技术强、落地难”的怪圈。明远智睿SD2351核心板的问世…...