MySQL 索引介绍和最佳实践
目录
- 一、前言
- 二、索引类型
- 1.1 主键索引(PRIMARY KEY)
- 1.2 唯一索引(UNIQUE)
- 1.3 普通索引(NORMAL)
- 1.3.1 单列普通索引
- 1.3.2 单列前缀普通索引
- 1.3.3 多列普通索引
- 1.3.4 多列前缀普通索引
- 1.4 空间索引(SPATIAL)
- 1.5 全文索引(FULLTEXT)
- 三、表数据准备(后续演示都基于这个表)
- 四、索引最佳实践
- 4.1 全值匹配
- 4.2 最左前缀原则
- 4.3 在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描
- 4.4 不能使用索引中范围查询条件右边的列
- 4.5 尽量使用覆盖索引
- 4.6 MySQL8.0之前在使用不等于(!=或者<>),not in ,not exists 的时候无法使用索引会导致全表扫描
- 4.7 is null,is not null 一般情况下也无法使用索引
- 4.8 like以通配符开头('%abc...')索引失效会变成全表扫描操作
- 4.9 字符串不加单引号索引失效
- 4.10 少用or或in,用它查询时,MySQL不一定使用索引
- 4.11 范围查询索引失效
- 五、索引使用总结
一、前言
索引是帮助高效获取数据排好序的数据结构,这里都会以MySQL InnoDB 存储引擎做讲解。
- InnoDB 存储引擎索引有两个特点
- 聚簇索引
索引与数据存放在一起、一张表只有一个聚簇索引找到索引的同时也找到了数据,同时聚簇索引具有唯一性,默认是主键,如果表中没有定义主键,InnoDB 会选择一个非空唯一索引代替。如果没有,InnoDB 会定义一个隐藏的_rowid 列来作为聚簇索引。 - 非聚簇索引
索引与数据分开存放,索引结构的叶子节点指向了数据的对应行,如:一个表id字段是主键索引,创建一个name字段的普通索引,叶子节点是指向对应主键索引的值,通过name字段的普通索引找到对应id值,然后通过id回表主键索引获取到行数据。
- 聚簇索引
二、索引类型
1.1 主键索引(PRIMARY KEY)
主键索引非空且唯一,在 InnoDB 存储引擎中会作为聚簇索引叶子节点会存放所有行数据。
ALTER TABLE `table_name` ADD PRIMARY KEY (`column`);
1.2 唯一索引(UNIQUE)
唯一索引值唯一,可为NULL值,而且可以多行数据为NULL值,也可以使用多个列作为唯一索引,在存储索引时会对多列组合唯一判断。
ALTER TABLE `table_name` ADD UNIQUE INDEX `index_name`(`column`) USING BTREE;
1.3 普通索引(NORMAL)
普通索引是我们最常用的一类索引,可以使用单个列作为索引,也可以使用多个列作为索引,多列索引也叫做复合索引或者组合索引,在字段的长度超过索引限制(索引最大长度是768字节),可以为字段的部分前缀创建索引。
1.3.1 单列普通索引
ALTER TABLE `table_name` ADD INDEX `index_name`(`column`);
1.3.2 单列前缀普通索引
ALTER TABLE `table_name` ADD INDEX `index_name`(`column`(2));
1.3.3 多列普通索引
ALTER TABLE `table_name` ADD INDEX `index_name`(`column1`, `column2`);
1.3.4 多列前缀普通索引
ALTER TABLE `table_name` ADD INDEX `index_name`(`column1`(2), `column2`(3));
1.4 空间索引(SPATIAL)
空间索引是对空间数据类型的字段建立的索引,MYSQL使用SPATIAL关键字进行扩展,使其能够在空间数据类型的语法上创建空间索引。
# 建表
CREATE TABLE `gis_position` (`id` INT NOT NULL,`gis` geometry NOT NULL COMMENT '空间位置信息',`geohash` VARCHAR ( 20 ) GENERATED ALWAYS AS (st_geohash ( `gis`, 12 )) VIRTUAL,PRIMARY KEY ( `id` )
) ENGINE = INNODB DEFAULT CHARSET = utf8mb4 COMMENT = '空间位置信息';# 创建空间索引
ALTER TABLE gis_position ADD SPATIAL INDEX `idx_gis` ( `gis` );
1.5 全文索引(FULLTEXT)
全文索引类似于 elasticsearch 这样的搜索引擎,会对索引内容进行分词,当然比起 elasticsearch 还是差一些。
ALTER TABLE `table_name` ADD FULLTEXT INDEX `index_name`(`column`);
三、表数据准备(后续演示都基于这个表)
我这里库使用的字符集为utf8mb4,一个字符占用4个字节,utf8占用3个字节,如果字段为varchar类型,需要加的2字节用来存储字符串长度,因为varchar是变长字符串。
CREATE TABLE `company_staff` (`id` bigint(20) NOT NULL AUTO_INCREMENT,`name` varchar(30) NOT NULL DEFAULT '' COMMENT '姓名',`age` int(11) NOT NULL DEFAULT '0' COMMENT '年龄',`position` varchar(20) NOT NULL DEFAULT '' COMMENT '职位',`interest` varchar(20) DEFAULT NULL COMMENT '兴趣爱好',`entry_time` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '入职时间',PRIMARY KEY (`id`),KEY `idx_name_age_position` (`name`,`age`,`position`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_0900_as_cs COMMENT='公司员工表';INSERT INTO company_staff(name,age,position,interest,entry_time) VALUES('Kerwin',28,'cto','唱跳',NOW());
INSERT INTO company_staff(name,age,position,interest,entry_time) VALUES('Alia',26,'dev','rap',NOW());
INSERT INTO company_staff(name,age,position,interest,entry_time) VALUES('Coco',26,'dev','篮球',NOW());
四、索引最佳实践
对MYSQL的 explain SQL分析工具不熟的可以看看 MySQL explain SQL分析工具详解与最佳实践
4.1 全值匹配
- 通过 name 字段精准匹配
EXPLAIN SELECT * FROM company_staff WHERE name= 'Kerwin';
这里可以看到使用了组合索引idx_name_age_position,我们的name字段为varchar(30),计算出name字段占用字节数为key_len = 30*4+2=122,和我们的执行计划中的key_len相等,同时ref为const,可以确定通过name字段精准匹配,使用到了组合索引idx_name_age_position,但是只使用到了一个name字段。
- 通过 name + age 字段精准匹配
EXPLAIN SELECT * FROM company_staff WHERE name= 'Kerwin' AND age=28;
和上面通过name字段匹配执行计划类似,name字段占用字节数为122,age字段为int类型,int类型占用4个字节,name + age 字段一共为126字节和执行计划的key_len相等,同时ref为const,const代表使用了两个字段常量,可以确定使用到了组合索引idx_name_age_position,并且使用到了两个字段name + age。
- 通过 name + age + position 字段精准匹配
EXPLAIN SELECT * FROM company_staff WHERE name= 'Kerwin' AND age=28 AND position='cto';
position字段为varchar(20),计算出字节数为20*4+2=82,在加上 name、age占用的字节数合计122+4+82=208字节和执行计划的key_len相等,同时ref为const,const,const代表使用了三个字段常量,确认idx_name_age_position索引中三个字段全部被使用到了。
4.2 最左前缀原则
如果索引了多列,要遵守最左前缀原则,指的是查询从索引的最左前列开始并且不跳过索引中的列。
PS:在MySQL8.0的时候加入了一个跳跃索引,在某些情况下会跳过中间没有被匹配的列去匹配后面的列,如果使用到了跳跃索引那么在Extra中会出现 Index skip scan。
- 通过 age 字段精准匹配
EXPLAIN SELECT * FROM company_staff WHERE age= 28;
我们直接使用age查询,这里发现没有使用到索引,因为我们的组合索引第一个值是name,如果查询条件中没有name值是无法使用索引的。
- 通过 name + position 字段精准匹配
EXPLAIN SELECT * FROM company_staff WHERE name= 'Kerwin' AND position='cto';
我们这里使用name + position 字段精准匹配,执行计划中显示使用到了索引,但是key_len=122,name字段占用的字节数刚好是122,证明这里虽然使用到了idx_name_age_position索引,但是只使用到了name一个字段匹配。
4.3 在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描
- 这里将name转化成小写查询
EXPLAIN SELECT * FROM company_staff WHERE LOWER(name)= 'kerwin';
4.4 不能使用索引中范围查询条件右边的列
- 通过name + position 精准匹配和age范围查询
EXPLAIN SELECT * FROM company_staff WHERE name= 'Kerwin' AND age<35 AND position='cto';
我们查询时age条件使用范围查询,这里可以看到key_len=126,name+age字节数为126,没有使用到position
4.5 尽量使用覆盖索引
查询条件和响应结果的列都存在索引中,这样只需要通过索引就能获取需要的数据,就不会在进行回表。
EXPLAIN SELECT name,age,position FROM company_staff WHERE name= 'Kerwin' AND age=28 AND position='cto';
4.6 MySQL8.0之前在使用不等于(!=或者<>),not in ,not exists 的时候无法使用索引会导致全表扫描
in、< 小于、 > 大于、 <=、>= 这些,MySQL内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引,MySQL8.0的时候不等于(!=或者<>),not in 也会根据检索比例、表大小等多个因素整体评估是否使用索引。
EXPLAIN SELECT * FROM company_staff WHERE name != 'Kerwin';
4.7 is null,is not null 一般情况下也无法使用索引
EXPLAIN SELECT * FROM company_staff WHERE name IS NULL;
4.8 like以通配符开头(‘%abc…’)索引失效会变成全表扫描操作
like查询是可以走索引的,但是只能通过前缀查询,不能以通配符开头。
- 模糊匹配 name 字段,以win结尾的数据
EXPLAIN SELECT * FROM company_staff WHERE name LIKE "%win";
- 模糊匹配 name 字段,以Ker开头的数据
EXPLAIN SELECT * FROM company_staff WHERE name LIKE "Ker%";
4.9 字符串不加单引号索引失效
字符串字段查询如果不加单引号或者算引号会发生隐式转换导致索引失效,如果是数字类型字段查询时使用单引号索引不会失效。
EXPLAIN SELECT * FROM company_staff WHERE name = 666;
发生隐式转换后SQL相当于变成SELECT * FROM company_staff WHERE CAST(name AS signed int) = 666;
,name字段使用了函数索引失效
4.10 少用or或in,用它查询时,MySQL不一定使用索引
MySQL内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引,拿我这里的数据来说,表里一共三条数据,我IN查询4个值以内(包含4个值)是可以走索引的,一旦超过4个值到了5个值索引就会失效了,MySQL内部优化器会认为我们要IN查询这5个值全表扫描耗时会比使用索引要快,因为使用非聚簇索引是需要回表的。
EXPLAIN SELECT * FROM company_staff WHERE name IN ('4Kerwin','3Kerwin','2Kerwin','1Kerwin','Kerwin');
4.11 范围查询索引失效
MySQL内部优化器会根据检索比例、表大小等多个因素整体评估是否使用索引,可能是由于单次数据量查询过大导致优化器最终选择不走索引。
要想看到效果需要先添加10000条数据的样子,如果只有几条数据是会一直走索引。
- 使用存储过程插入10000条数据
## 创建一个插入数据的存储过程
DROP PROCEDURE IF EXISTS insert_company_staff;
delimiter;;
CREATE PROCEDURE insert_company_staff ()
BEGINDECLARE i INT;SET i = 1;WHILE ( i <= 10000 ) DOINSERT INTO `company_staff`(`name`, `age`, `position`, `interest`, `entry_time`) VALUES (CONCAT('Kerwin',i), 28 + i, 'cto', '唱跳', NOW());SET i = i + 1;END WHILE;
END;;
delimiter;// 调用存储过程插入数据
CALL insert_company_staff ();
- 给年龄添加单值索引
ALTER TABLE `company_staff` ADD INDEX `idx_age`(`age`);
- 范围查询数据
EXPLAIN SELECT * FROM company_staff WHERE age >= 1 AND age <= 3000
如果查询范围比较大索引可能会失效,缩小查询范围是可以走索引的,最终是否走索引还是MySQL内部优化器会根据检索比例根据表大小等多个因素整体评估。
五、索引使用总结
假设有一个组合索引 index(a,b,c)
where语句 | 是否使用索引 |
---|---|
where a = 3 | 是:使用到a |
where a = 3 and b = 5 | 是:使用到a,b |
where a = 3 and b= 5 and c = 4 | 是:使用到a,b.c |
where b = 3 或 where b = 3 and c = 4 或 where c = 4 | 否 |
where a = 3 and c = 5 | 是:使用到a,但是c不可以,b中间断了 |
where a = 3 and b > 4 and c=5 | 是:使用到a和b,c不能用在范围之后,b断了 |
where a = 3 and b like "kk%’ and c =4 | 是:使用到a,b.c |
where a = 3 and b like ‘%kk’ and c = 4 | 是:只用到a |
where a = 3 and b like ‘%kk%’ and c =4 | 是:只用到a |
where a = 3 and b like ‘k%kk%’ and c = 4 | 是:使用到a,b,c |
like KK%相当于=常量,%KK和%KK%相当于范围
相关文章:

MySQL 索引介绍和最佳实践
目录 一、前言二、索引类型1.1 主键索引(PRIMARY KEY)1.2 唯一索引(UNIQUE)1.3 普通索引(NORMAL)1.3.1 单列普通索引1.3.2 单列前缀普通索引1.3.3 多列普通索引1.3.4 多列前缀普通索引 1.4 空间索引&#x…...
区块链(7):p2p去中心化之初始化websoket服务端
1 整个流程梳理 服务开启onStart()连接打开onOpen()处理接收到的消息onMesage()连接关闭onClose()异常处理onError()2 创建p2p实现类 package com.example.demo.service;import com.example.demo.entity.BlockChain; import org.java_websocket.WebSocket; import org.java_we…...

原型、原型链、判断数据类型
目录 作用 原型链 引用类型:__proto__(隐式原型)属性,属性值是对象函数:prototype(原型)属性,属性值是对象 Function:本身也是函数 相关方法 person.prototype.isPrototypeOf(stu) Object.getPrototypeOf(objec…...

pycharm中配置torch
在控制台cmd中安装好torch后,在pycharm中使用torch,需要进行简单设置即可。 在pycharm中新建一个工程,在file文件中打开setting 在setting中找到project interpreter编译器 找到conda environment的环境配置,设置好相应的目录 新…...

什么是Times New Roman 字体
如何评价 Times New Roman 字体?:https://www.zhihu.com/question/24614549?sortcreated 新罗马字体是Times New Roman字体,是Office Word默认自带的英文字体之一。 中英文字体 写作中,英文和数字的标准字体为 Times New Roma…...

企业会议新闻稿怎么写?会议类新闻稿如何撰写?
企业会议新闻稿是企业对外传递信息的重要途径之一,它能够将企业的决策、动态以及成果展示给公众。本文伯乐网络传媒将详细解析企业会议新闻稿的写作要点和技巧,以及常见问题及解决方法,帮助大家更好地完成企业会议新闻稿的撰写工作。 一、企业…...
算法 滑动窗口最大值-(双指针+队列)
牛客网: BM45 题目: 数组num, 窗口大小size, 所有窗口内的最大值 思路: 用队列作为窗口,窗口内存储数组坐标,left window[0], right从数组0开始遍历完数组,每次新增元素时,(1)先对窗口大小进行收缩到size大小范围,即…...

Java 并发编程面试题——BlockingQueue
目录 1.什么是阻塞队列 (BlockingQueue)?2.BlockingQueue 有哪些核心方法?3.BlockingQueue 有哪些常用的实现类?3.1.ArrayBlockingQueue3.2.DelayQueue3.3.LinkedBlockingQueue3.4.PriorityBlockingQueue3.5.SynchronousQueue 4.✨BlockingQu…...
Ubuntu Nacos开机自启动服务
1、创建service文件 在/lib/systemd/system目录下创建nacos.service文件 [Unit] Descriptionalibaba nacos Afternetwork.target Documentationhttps://nacos.io/zh-cn/[Service] Userroot Grouproot Typeforking Environment"JAVA_HOME/usr/local/programs/jdk-8u333-li…...

C++核心编程--继承篇
4.6、继承 继承是面向对象三大特征之一 有些类与类之间存在特殊的关系,例如下图中: 我们发现,定义这些类的定义时,都拥有上一级的一些共性,还有一些自己的特性。那么我们遇到重复的东西时,就可以考虑使…...
小程序 解决自定义弹窗滚动穿透问题,解决弹窗背景内容滚动问题
方法一、catchtouchmove"true", 可以实现弹框背景不滚动,但是也会导致弹框自身无法滚动,如果你的弹窗本身是不需要滚动的,用这个方法是极佳的。 <view class"pop" catchtouchmove"true"> …...

win10搭建Selenium环境+java+IDEA(2)
接着上一个搭建环境开始叙述:win10系统x64安装java环境以及搭建自动化测试环境_荟K的博客-CSDN博客 上一步结尾的浏览器驱动,本人后面改到了谷歌浏览器.exe文件夹下: 这里需要注意,这个新路径要加载到系统环境变量中。 上一步下…...

抢先一步感受未来:Raspberry Pi 5正式发布!
在经历了几年全球供应链困境导致 Raspberry Pi 单板计算机的产能降低和零售价格上涨之后,今天终于迎来了更新。Raspberry Pi 4 上市四年后,今天Raspberry Pi 5正式发布!新推出的 Raspberry Pi 5 配备了经过大幅改进升级的SoC,带来…...

【教程】Ubuntu自动查看有哪些用户名与密码相同的账户,并统一修改密码
转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn] 目录 背景说明 开始操作 修改密码 背景说明 有些用户为了图方便或者初始创建用户默认设置等原因,会将密码设置为与用户名相同,但这就使得非常不安全。甚至如果该用户具有sudo权限&#…...

基于 Python+DenseNet121 算法模型实现一个图像分类识别系统
项目展示 一、介绍 DenseNet(Densely Connected Convolutional Networks)是一种卷积神经网络(CNN)架构,2017年由Gao Huang等人提出。该网络的核心思想是密集连接,即每一层都接收其前面所有层的输出作为输…...
贪心算法-点灯问题
1、题目描述 给定一个字符串str,只由 ‘X’ 和 ‘.’ 两种字符构成。‘X’ 表示墙,不能放灯,点亮不点亮都可;’.’ 表示居民点,可以放灯,需要点亮。如果灯放在i位置,可以让 i-1,i 和…...

软件测试之单元测试自动化入门基础
单元测试自动化 所谓的单元测试(Unit Test)是根据特定的输入数据,针对程序代码中的最小实体单元的输入输出的正确性进行验证测试的过程。所谓的最小实体单元就是组织项目代码的最基本代码结构:函数,类,模块等。在Python中比较知名…...

93 # 实现 express 错误处理中间件
上一节实现了 express 的中间件,这一节来实现错误处理中间件 执行某一步出错了,统一规定调用 next 传递的参数就是错误信息 先看 express 实现的demo const express require("express"); const app express();app.use("/", (re…...
PHP 创建 MySQL 表
目录 PHP 创建 MySQL 表 使用 MySQLi 和 PDO 创建 MySQL 表 实例 (MySQLi - 面向对象) 实例 (MySQLi - 面向过程) 实例 (PDO) PHP 创建 MySQL 表 一个数据表有一个唯一名称,并有行和列组成。 使用 MySQLi 和 PDO 创建 MySQL 表 CREATE TABLE 语句用于创建 MySQ…...

中兴R5300 G4服务器iSAC管理员zteroot密码遗失的重置方法及IPV6地址启用设置
本文讲解中兴R5300 G4服务器BMC带外iSAC管理员zteroot密码遗失,无法登录时如何对其进行密码重置,以及iSAC启用IPV6地址的方法。 一、重置中兴R5300 G4服务器iSAC管理员zteroot密码 1、通过SSH登录到iSAC,默认用户名:sysadmin&am…...

测试微信模版消息推送
进入“开发接口管理”--“公众平台测试账号”,无需申请公众账号、可在测试账号中体验并测试微信公众平台所有高级接口。 获取access_token: 自定义模版消息: 关注测试号:扫二维码关注测试号。 发送模版消息: import requests da…...
React Native 导航系统实战(React Navigation)
导航系统实战(React Navigation) React Navigation 是 React Native 应用中最常用的导航库之一,它提供了多种导航模式,如堆栈导航(Stack Navigator)、标签导航(Tab Navigator)和抽屉…...

基于ASP.NET+ SQL Server实现(Web)医院信息管理系统
医院信息管理系统 1. 课程设计内容 在 visual studio 2017 平台上,开发一个“医院信息管理系统”Web 程序。 2. 课程设计目的 综合运用 c#.net 知识,在 vs 2017 平台上,进行 ASP.NET 应用程序和简易网站的开发;初步熟悉开发一…...
在HarmonyOS ArkTS ArkUI-X 5.0及以上版本中,手势开发全攻略:
在 HarmonyOS 应用开发中,手势交互是连接用户与设备的核心纽带。ArkTS 框架提供了丰富的手势处理能力,既支持点击、长按、拖拽等基础单一手势的精细控制,也能通过多种绑定策略解决父子组件的手势竞争问题。本文将结合官方开发文档,…...
python如何将word的doc另存为docx
将 DOCX 文件另存为 DOCX 格式(Python 实现) 在 Python 中,你可以使用 python-docx 库来操作 Word 文档。不过需要注意的是,.doc 是旧的 Word 格式,而 .docx 是新的基于 XML 的格式。python-docx 只能处理 .docx 格式…...

BCS 2025|百度副总裁陈洋:智能体在安全领域的应用实践
6月5日,2025全球数字经济大会数字安全主论坛暨北京网络安全大会在国家会议中心隆重开幕。百度副总裁陈洋受邀出席,并作《智能体在安全领域的应用实践》主题演讲,分享了在智能体在安全领域的突破性实践。他指出,百度通过将安全能力…...
聊一聊接口测试的意义有哪些?
目录 一、隔离性 & 早期测试 二、保障系统集成质量 三、验证业务逻辑的核心层 四、提升测试效率与覆盖度 五、系统稳定性的守护者 六、驱动团队协作与契约管理 七、性能与扩展性的前置评估 八、持续交付的核心支撑 接口测试的意义可以从四个维度展开,首…...
#Uniapp篇:chrome调试unapp适配
chrome调试设备----使用Android模拟机开发调试移动端页面 Chrome://inspect/#devices MuMu模拟器Edge浏览器:Android原生APP嵌入的H5页面元素定位 chrome://inspect/#devices uniapp单位适配 根路径下 postcss.config.js 需要装这些插件 “postcss”: “^8.5.…...

让回归模型不再被异常值“带跑偏“,MSE和Cauchy损失函数在噪声数据环境下的实战对比
在机器学习的回归分析中,损失函数的选择对模型性能具有决定性影响。均方误差(MSE)作为经典的损失函数,在处理干净数据时表现优异,但在面对包含异常值的噪声数据时,其对大误差的二次惩罚机制往往导致模型参数…...

基于PHP的连锁酒店管理系统
有需要请加文章底部Q哦 可远程调试 基于PHP的连锁酒店管理系统 一 介绍 连锁酒店管理系统基于原生PHP开发,数据库mysql,前端bootstrap。系统角色分为用户和管理员。 技术栈 phpmysqlbootstrapphpstudyvscode 二 功能 用户 1 注册/登录/注销 2 个人中…...