当前位置：首页 > news >正文

MySQL索引1——基本概念与索引结构（B树、R树、Hash等）

news 2026/4/17 23:19:35

索引(INDEX)基本概念

索引结构分类

B+Tree树索引结构

Hash索引结构

Full-Text索引

R-Tree索引

索引(INDEX)基本概念

什么是索引

索引是帮助MySQL高效获取数据的有序数据结构

为数据库表中的某些列创建索引，就是对数据库表中某些列的值通过不同的数据结构进行排序

为列建立索引之后，数据库除了维护数据之外，还会维护满足特定查找算法的数据结构，这些数据结构以某种方式指向数据，这样就可以在这些数据结构上实现快速查询，这种数据结构就是索引

索引的作用

通过索引可以将无序的数据变为有序的数据，能够实现快速访问数据库表中的特定信息

优缺点

优点

提高数据检索的效率，降低数据库的IO成本

通过索引对数据进行排序，降低数据排序的成本，降低CPU的消耗

缺点

索引会占用空间

索引提高了表的查询效率，但是却降低了更新表的速度（Insert、Update、Delete）

索引只是一个提高效率的因素，如果MySQL有大数据量的表，就需要花时间研究最优秀的索引（即需要研究为哪些字段建立索引能够使得效率提升到最大化，因为一条查询语句只会引用到一种索引，并且一般建议一个表建立的索引数量不要超过5个）

索引结构分类

索引结构主要分为四大类

B+Tree索引-（B+树）

最常见的索引类型，大部分的存储引擎都支持此索引

Hash索引-（Hash表）

底层的数据结构是用哈希表实现的，只有精确匹配索引列的查询才有效，不支持范围查询

Full-Text索引-（倒排索引）

又名全文索引，是一种通过建立倒排索引，快速匹配文档的方式

R-Tree索引（R-Tree树）

又名空间索引，是MyISAM引擎的一个特殊索引类型，主要用于地理位置数据，使用较少

存储引擎对不同索引的支持情况（默认B+Tree索引）

在MySQL数据库中，支持Hash索引的是Memory引擎；而InnoDB中具有自适应Hash的功能，根据B+tree索引在指定条件下自动构建的

B+Tree树索引结构

B+Tree树是由二叉树 → 红黑树（自平衡二叉树） → B-Tree树烟花而来的，我们在介绍B+Tree树之前先介绍这三种数据结构

二叉树

二叉树的每个节点最多有两个子节点（两颗子树）；并且两个子节点是有序的

以单个节点为例：左边子节点是比自身小的，右边子节点是比自身大的

缺点

大数据量的情况下，层级较深，检索速度慢
容易形成倾斜树（左倾斜或右倾斜）

二叉树的工作原理

二叉树的数据插入（依次插入30、40、20、19、21、39、35）

二叉树的数据遍历

二叉树的数据查找（查找39 、21、25）

二叉树的数据删除（依次删除19、39、30）

红黑树（自平衡二叉树）

红黑树时二叉树的变种，可以解决二叉树插入数值时产生斜树的问题

任何一个节点都有颜色(红色或黑色)，通过颜色来确保树在插入和删除时的平衡

根节点一定是黑色的；Null节点被认为是黑色的；每个红色节点的两个叶子节点都是黑色

每个叶子节点到根的路径上不能出现连续的红色节点

任何一个节点到达叶子节点所经过的黑节点个数必须相等

当在红黑树中进行插入和删除操作时，会通过左旋、右旋、重新着色来修复树结构，保持树的平衡

缺点

在进行大量插入和删除操作的情况下，可能会造成频繁的树重构，影响性能
红黑树的实现比较复杂，需要维护节点的颜色和平衡
红黑树本质也是二叉树，在大数据量的情况下，层级较深，检索速度会下降

红黑树的工作原理

红黑树的数据插入（依次插入30、40、20、19、21、39、35）使用到了右旋

红黑树的数据遍历

红黑树的数据查找（查找39 、21、25）

红黑树的数据删除（依次删除19、39、30）

B-Tree树（多路平衡查找树）

二叉树一个Node节点只能够存储一个Key和一个Value，并且只有两个子节点；而多路树相比较而言一个Node节点能够存储更多的Key和Value，能够携带更多的子节点，建树高度会比二叉树要低

B-Tree树的一个节点能够存储多少Key和Value，可以有多少个子节点通过最大度数（MAX-Degree 也称为阶数）决定

一个m阶的B-Tree树

树中的每个节点最多有m个子节点，m-1个Key和Value（两个子树的指针夹着一个Key和Value）

树的根节点至少有一个Key和Value，至少两个子节点

缺点

B树的叶子节点和非叶子节点都会保存数据，使得非叶子节点保存的指针量变小

如果存储大量的数据，需要增加树的高度，导致IO操作变多，查询性能变低

B-Tree树的工作原理

B-Tree树的数据插入Max-Degree为3（依次插入30、40、20、19、21、39、35）

B-Tree树的数据遍历

B-Tree树的数据查找（查找39 、21、25）

B-Tree树的数据删除（依次删除19、39、30）

B+Tree树

B+Tree树是B-Tree树的变种，也是一种多路搜索树，定义基本与B-Tree相同

B+Tree只有叶子节点存储数据，并且所有的元素都会出现在叶子节点中，所有叶子节点形成了一个单向链表；叶子节点将数据按照大小排列，并且相邻叶子节点之间按照大小排列

非叶子节点不存储数据，只存储Key，只是起到索引的作用，在相同的数据量下，B+Tree树更加矮壮

B-Tree树的工作原理

B+Tree树的数据插入Max-Degree为3（依次插入30、40、20、19、21、39、35）

B+Tree树的数据遍历

B+Tree树的数据查找（查找39 、21、25）

B+Tree树的数据删除（依次删除19、39、30）

MySQL的B+Tree索引结构

MySQL的索引数据结构对经典的B+Tree进行了优化，在原B+Tree的基础上，增加了一个指向相邻叶子节点的链表指针，所有叶子节点形成了一个双向链表，提高了遍历速度

MySQL在查询是根据查询条件查询对应的键值（Key），然后将键值对应数据（Value）提取出来

Hash索引结构

哈希索引就是采用一定的hash算法，将键值换算成新的Hash值，将哈希值映射到一个桶中，桶中存储了所有哈希值相同的数据行的指针，然后存储在Hash表中；

当查询时，MySQL会先通过哈希函数计算出查询条件的哈希值，在Hash表中查找对应的桶，然后在对应的桶中查找相应的数据行

哈希冲突

如果两个或多个键值，映射到同一个相同的槽位（桶），则他们就产生了hash冲突，通过链表解决

特点

Hash索引只能够用于对等比较（=，in等），不支持范围查询（between，>，<等）
无法利用Hash索引完成排序操作；因为Hash索引中存放的是经过Hash计算后的Hash值，此值的大小并不一定和Hash运算之前的键值完全一样
Hash索引无法避免表扫描，即每次都要全表扫描；因为Hash索引是将键值通过Hash运算之后，将其结果和对应的行指针信息存放在一个Hash表中，由于不同的索引键可能存在相同的Hash值，也就是哈希冲突，所以满足某个Hash键值的数据的记录跳数，无法直接从Hash索引中直接完成查询，还是要通过访问表中的实际数据进行比较，并得到相应的结果
对于联合索引，Hash不能使用部分索引键查询（要么全部使用，要么全部不使用）
Hash只需要做一次运算，就可以找到该数据所在的桶；不像树结构那样从根、叶子节点的顺序来查找；所以Hash索引的查询效率理论上是要高于B+Tree的；不过对于存在大量Hash值相同的情况下，性能不一定比B+Tree高

Full-Text索引

通过建立倒排索引（Inverted Index）构建Full-Text索引，提高数据的检索效率

倒排索引是一种将文档中的单词/汉字映射到其出现位置的数据结构，主要用来解决判断字段的值中是否包含某字符/汉字的问题

我们对于简单业务或者数据量小的业务，可以通过Like()关键字来判断；但是对于大数据量业务，使用Like效率会大大降低

不同存储索引对Full-Text索引的支持

在MySQL5.6版本之前，只有MYISAM存储引擎支持全文索引

在MySQL5.6版本之后，InnoDB能够支持全文索引；不过只支持对英文的全文索引，不支持中文的全文索引；后续通过内置分词器（ngram）来支持中文索引

配置ngram的最小长度

在MySQL的配置文件中添加以下字段

ft_min_word_len = 2 #此最小长度就是分词的最小长度，默认为2

即：对于一段语句，可以分为多个汉字组，每个汉字组最少都有2个汉字

我想学习数据库可以分词为：我想学习数据库三个组

一般不会将ngram设置的很小，如果很小的话会占用大量的空间，因此我们一般都不修改此最小长度，就默认为2

全文索引的流程

用户输入要查找的内容 → SQL执行引擎 → ngram对查找的内容进行分词 → 把分词后的词依次的去倒排索引中去查找 → 将相应的记录返回

分词器ngram在建立索引时会对字段中的值进行分词；在进行查询时也会对要查找的内容分词

R-Tree索引

构建空间索引有多种数据结构，例如四叉树、R-Tree树

在MySQL中是通过R-Tree树来构建空间索引的，是一种加快空间数据查询速度的技术

R-tree将空间数据分割成一系列矩形区域，每个节点可以表示一个矩形区域，同时可以包含其他节点或数据项。这种层级结构允许MySQL在空间查询中更快地定位所需的数据，减少搜索范围，从而提高查询性能

例如：

一个表中的某字段存储着一个地方餐馆的经纬度位置信息，现在我们需要根据我们的位置，找附近1公里的餐馆

我们可以通过计算我们的位置，找到附近1公里范围内的经纬度范围，然后查询表中的满足此经纬度的值；为了加快检索效率，我们就可以对存储经纬度位置信息的字段建立空间索引

R-Tree的构建过程——R树是把B树的思想扩展到了多维空间

1、数据划分

所有的数据项也成为对象（点、线或面）都被视为一个单独的矩形

2、构建叶子节点（叶子节点是R树的底层节点）

将划分好的矩形进行分组，并构建叶子节点；每个叶子节点包含多个对象及其对应的矩形

3、合并叶子节点

当叶子节点的数目超过了R-Tree规定的最大容量，此时R树会尝试合并相邻的叶子节点来减少树的高度和提高查询效率

4、构建非叶子节点

将合并后叶子构建为新的非叶子节点；非叶子节点也是一个矩形，包含了其所有子节点的矩形范围

5、递归构建

重复上述的操作，知道构建出整个R树的根节点（R树的最顶层节点，将包含所有的数据范围）

具体R树的构建方式可以参考以下文章

从B树、B+树、B*树谈到R 树_v_JULY_v的博客-CSDN博客https://blog.csdn.net/v_JULY_v/article/details/6530142

MySQL索引1——基本概念与索引结构（B树、R树、Hash等）

目录索引(INDEX)基本概念索引结构分类 BTree树索引结构 Hash索引结构 Full-Text索引 R-Tree索引索引(INDEX)基本概念什么是索引索引是帮助MySQL高效获取数据的有序数据结构为数据库表中的某些列创建索引，就是对数据库表中某些列的值通过不同的数据结…...

编程日记 2023/8/4 7:38:26

TikTok数据分析 | 用好超店有数，生意增长快人一步

TikTok在东南亚崛起之快令人叹服。在东南亚第一大经济体印度尼西亚，超过200万小商家入驻了TikTok的电商平台； TikTok Shop 以6.9亿美元的收入市场份额超越Lazada成为越南第二大电商平台； 2023年泰国TikTok Shop的销售额一路猛涨&#xff…...

编程日记 2023/8/4 7:37:24

从零开始学Docker（三）：DockerFile镜像定制

宿主机环境：RockyLinux 9 前言，定制docker镜像的方式有两种： 手动修改容器内容，然后docker commit提交容器为新的镜像通过在dockerfile中定义一系列的命令和参数构成的脚本，然后这些命令应用于基础镜像，依…...

编程日记 2023/8/4 7:36:22

【Linux】 UDP网络套接字编程

🍎作者：阿润菜菜 📖专栏：Linux系统网络编程文章目录一、网络通信的本质（port标识的进程间通信）二、传输层协议UDP/TCP认识传输层协议UDP/TCP网络字节序问题（规定大端） 三、socket编…...

编程日记 2023/8/4 7:35:21

《golang设计模式》第一部分·创建型模式-05-工厂方法模式（Factory Method）

文章目录 1 概述2.1 角色2.2 类图 2 代码示例2. 1 设计2.2 代码2.3 类图 3. 简单工厂3.1 角色3.2 类图3.3 代码示例3.3.1 设计3.3.2 代码3.3.3 类图 1 概述工厂方法类定义产品对象创建接口，但由子类实现具体产品对象的创建。 2.1 角色 Product（抽象产…...

编程日记 2023/8/4 7:34:18

Kubernetes 概述

1、K8S 是什么？ K8S 的全称为 Kubernetes (K12345678S) 作用用于自动部署、扩展和管理“容器化（containerized）应用程序”的开源系统。可以理解成 K8S 是负责自动化运维管理多个容器化程序（比如 Docker）的集群&#…...

编程日记 2023/8/4 7:33:17

Electron + Vue3 + Vite + TS 构建桌面应用

之前是使用React、Electron、TS和webpack来构建桌面应用的。虽然功能齐全，但是打包等等开发的体验不太理想，总感觉太慢了。作为一个开发者，我们总是希望，执行构建命令后，可以快速打包或者启动本地应用，且通过更少的配置，来完成开发体验。现在的vite已经得到广泛的应用…...

编程日记 2023/8/4 7:32:16

springboot访问请求404的原因

是记录，可能出现错误可能出现的原因 1.你请求的URL路径不对,比如说你请求的路径是/usr/list,GET方法,但是你UserController上面的RequestMapping是这个样子:RequestMapping(“user”)，有可能哈 2.前端的请求时GET方法，后端对应的处理函数的方…...

编程日记 2023/8/4 7:31:14

网络安全零基础该如何自学？

一、为什么选择网络安全？ 这几年随着我国《国家网络空间安全战略》《网络安全法》《网络安全等级保护2.0》等一系列政策/法规/标准的持续落地，网络安全行业地位、薪资随之水涨船高。未来3-5年，是安全行业的黄金发展期，提前踏入…...

编程日记 2023/8/4 7:30:13

Git(丢失stash数据恢复）

在这里总结一下昨天遇到的问题，我本想将本地代码push到远端仓库，依次运行了以下命令 git init //初始化 git add . //将本地代码添加到暂存区 git commit -m 注释 //将暂存区内容添加到本地仓库中。结果这时发生了代码冲突，我的代码全没了&a…...

编程日记 2023/8/4 7:29:12

Maven依赖管理

依赖特性： 1、依赖配置 2、依赖传递 3、可选依赖 4、排除依赖 5、依赖范围...

编程日记 2023/8/4 7:28:10

【电网技术复现】考虑实时市场联动的电力零售商鲁棒定价策略（Matlab代码实现）

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势：🌞🌞🌞博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。 ⛳️座右铭&a…...

编程日记 2023/8/4 7:27:09

R语言中数据重塑（长宽表的转化）

学习笔记，仅供学习使用。目录 1-什么是整洁的数据？ 2-宽表变成长表示例1： 示例2： 示例3： 3-长表变宽表示例1： 示例2： 1-什么是整洁的数据？ 按照Hadley的表述&#xf…...

编程日记 2023/8/4 7:26:08

C# Blazor 学习笔记(10):依赖注入

文章目录前言Blazor 依赖注入依赖注入用于解决什么问题？依赖注入的生命周期。测试代码总结前言 Blazor 具有前后端不分离模式，但是如何直接调用需要一定的设置 Blazor 依赖注入依赖注入在spring里面很常见，毕竟.NET 是个巨型融合怪。只…...

编程日记 2023/8/4 7:25:07

接口请求（get、post、head等）详解

一．接口请求的六种常见方式： 1、Get 向特定资源发出请求（请求指定页面信息，并返回实体主体） 2、Post 向指定资源提交数据进行处理请求（提交表单、上传文件），又可能导致新的资源的建…...

编程日记 2023/8/4 7:24:06

【【萌新的STM32学习-4】】

萌新的STM32学习-4 STM32系统框架 1.1 Cortex M 内核& 芯片 F1有四个驱动单元四个被动单元 AHB 高级高性能总线 APB 高级外围总线部分系统结构最上面的ICode 总线直接连接到了内部Flash 不需要通过总线矩阵 . D Code 总线（D - Bus） 这是Cort…...

编程日记 2023/8/4 7:23:04

C++ Primer Plus第五章习题

目录复习题： 1.入口条件循环和出口条件循环之间的区别是什么？各种c循环分别属于其中的哪一种？ 2.如果下面的代码片段是有效程序的组成部分，它将打印什么内容？ 3.如果下面的代码片段是有效程序的组成部分&#xff0…...

编程日记 2023/8/4 7:22:03

软考A计划-系统集成项目管理工程师-信息文档和配置管理-上

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例点击跳转>软考全系列点击跳转>蓝桥系列 👉关于作者专注于Android/Unity和各种游…...

编程日记 2023/8/4 7:21:02

Vue 路由路由守卫

路由守卫正如其名， vue-router 提供的导航守卫主要用来通过跳转或取消的方式守卫导航。简单来说，就是在路由跳转时候的一些钩子，当从一个页面跳转到另一个页面时，可以在跳转前、中、后做一些事情。当你打开一个页面的前后需…...

编程日记 2023/8/4 7:20:01

基于springboot的课程作业管理系统【附开题|ppt|万字文档(LW)和搭建文档】

主要功能学生登录： ①首页、个人中心：修改密码、个人信息管理等 ②公告信息管理、课程信息管理、学生选课管理、作业布置管理、作业提交管理、作业评分管理、课程评价管理、课程资源管理教师登录： ①首页、个人中心：修改密码、…...

编程日记 2023/8/4 7:19:00

大厂面试：TCP四次挥手，可以变成三次吗？

上周有位读者面美团时，被问到：TCP 四次挥手中，能不能把第二次的 ACK 报文， 放到第三次 FIN 报文一起发送？虽然我们在学习 TCP 挥手时，学到的是需要四次来完成 TCP 挥手，但是在一些情况下&#x…...

编程新知 2026/4/17 23:18:04

告别base环境自动激活：CentOS7安装Miniconda后必做的几项贴心配置

告别base环境自动激活：CentOS7安装Miniconda后必做的几项贴心配置当你第一次在CentOS7服务器上成功安装Miniconda后，可能会遇到一个令人困扰的默认行为：每次打开新终端会话时，conda都会自动激活base环境。对于需要通过SSH频繁连接…...

编程新知 2026/4/17 22:41:01

【2026奇点智能技术大会权威解码】：AI原生数据结构生成的5大范式跃迁与工程落地路径

第一章：2026奇点智能技术大会：AI数据结构生成 2026奇点智能技术大会(https://ml-summit.org) 核心突破：语义驱动的数据结构合成引擎本届大会首次公开发布StructGen v3.1——一个基于多模态推理与形式化约束求解的AI数据结构生成框架。它不…...

编程新知 2026/4/17 22:30:51

Cadence Virtuoso 6.17 保姆级教程：手把手教你完成一个简单放大器的瞬态仿真

Cadence Virtuoso 6.17 保姆级教程：手把手教你完成一个简单放大器的瞬态仿真刚接触模拟IC设计时，最令人头疼的莫过于面对复杂的EDA工具却不知从何下手。Cadence Virtuoso作为行业标准工具，功能强大但学习曲线陡峭。本文将用最直观的方式&…...

编程新知 2026/4/17 22:24:43

GitLab vs Gitee企业版深度对比：国内团队如何选择最适合的私有化部署方案？

GitLab vs Gitee企业版深度对比：国内团队如何选择最适合的私有化部署方案？ 在数字化转型浪潮中，代码托管平台已成为企业研发体系的核心基础设施。对于金融、政务等对数据安全要求严格的行业，私有化部署不仅是技术选择，…...

编程新知 2026/4/17 22:20:34

别再只跑Demo了！用Fast-ReID训练自定义ReID模型，真正提升你的YoloV5+DeepSORT项目效果

从Demo到实战：基于Fast-ReID打造高精度自定义行人重识别系统在计算机视觉领域，行人重识别(ReID)技术正逐渐成为智能监控、零售分析和智慧城市等场景中的核心组件。然而，许多开发者在实际项目中常常遇到一个尴尬局面——在演示环境中运行良好…...

编程新知 2026/4/17 20:38:53

Qwen3.5-9B Typora Markdown写作助手：智能大纲生成与格式优化

Qwen3.5-9B Typora Markdown写作助手：智能大纲生成与格式优化 1. 技术写作的新助手技术文档和博客写作一直是开发者、产品经理和技术博主们的日常必修课。但很多人都有过这样的经历：面对空白文档不知从何下笔，写了一半发现结构混乱&#x…...

编程新知 2026/4/17 19:05:53

GLASS：梯度上升驱动的工业图像异常合成与检测新范式

1. GLASS框架：工业图像异常检测的破局者在精密制造领域，一个肉眼难以察觉的微小划痕可能导致整批产品报废。传统质检员每天要盯着流水线检查上万件产品，这种高强度作业下漏检率往往高达15%-20%。而现有的AI检测方案面对这种"弱缺陷&quo…...

编程新知 2026/4/17 18:49:19

ImageToSTL：轻松实现图片到3D打印模型的完整创意转换指南

ImageToSTL：轻松实现图片到3D打印模型的完整创意转换指南【免费下载链接】ImageToSTL This tool allows you to easily convert any image into a 3D print-ready STL model. The surface of the model will display the image when illuminated from the left sid…...

编程新知 2026/4/17 17:33:22

SAP AMDP实战避坑指南：从CDS Table Function到Procedure的完整配置流程

SAP AMDP深度实战：从CDS Table Function到Procedure的高效配置与避坑指南当ABAP开发者需要在SAP HANA环境中实现高性能数据库逻辑时，AMDP（ABAP-Managed Database Procedures）已经成为不可或缺的技术选择。不同于传统的ABAP代码&…...

编程新知 2026/4/17 16:25:37

索引(INDEX)基本概念

索引结构分类

B+Tree树索引结构

Hash索引结构

Full-Text索引

R-Tree索引

相关文章：