当前位置: 首页 > article >正文

数据库索引深度解析:原理、类型与高效使用实践

🧠 一句话理解索引是什么?

索引就是数据库中的“目录”或“书签”,它能帮助我们快速找到数据的位置,而不是一页页地翻整本书。
在这里插入图片描述


🧩 一、为什么需要索引?(用生活化例子秒懂)

想象你在图书馆找一本书中的一个关键词:

  • 没有索引的情况:你只能从第一页一页一页地翻,直到找到关键词(全表扫描)。
  • 有索引的情况:你直接去目录查到页码,快速翻过去(通过索引快速定位)。

所以索引的作用很明确:

  • 加快查询速度
  • 加速 WHERE / JOIN / ORDER BY 等操作
  • 在大数据量下提升性能至关重要

📦 二、索引的分类(面试考察重点)

分类类型说明
按结构划分B+ Tree 索引(最常见)平衡多叉树,查询效率高(MySQL 默认使用)
Hash 索引基于哈希表,等值查询快,不支持范围查找
按字段数划分单列索引针对一个字段创建的索引
复合索引包含多个字段,顺序非常重要(最左前缀原则
按用途划分主键索引主键默认建立的唯一索引
唯一索引保证字段唯一性,如用户名、身份证号等
普通索引仅加速查询,不限制重复
全文索引支持模糊匹配,如搜索引擎关键字匹配(MySQL 5.6+ 支持 InnoDB 全文索引)
空间索引专门用于地理信息查询(GIS 数据)

🚀 三、实际业务中索引的典型应用场景

✅ 场景 1:用户登录

SELECT * FROM user WHERE username = 'zhangsan';

如果 username 上没有索引,数据库会全表扫描,非常慢。添加普通索引即可加速。

✅ 场景 2:订单查询(范围查找)

SELECT * FROM orders WHERE create_time BETWEEN '2023-01-01' AND '2023-01-31';

此类范围查询适合建立 B+ 树索引,因为 B+ 树结构天然支持区间查找。

✅ 场景 3:多字段搜索

SELECT * FROM user WHERE age = 25 AND gender = 'male';

可以考虑建立复合索引 (age, gender),提升多条件过滤的效率。


📐 四、索引的底层原理 —— 为什么是 B+ 树?

B+ Tree 是一种 多路平衡搜索树,它比二叉树更“胖”,查询次数更少。

结构特点:

  • 所有值都存储在叶子节点
  • 所有叶子节点形成链表,方便范围查找
  • 非叶子节点只存储索引键,不存储具体数据

为什么不是 Hash?

特性B+ TreeHash
支持范围查找
有序
支持排序
适合范围、排序、LIKE 前缀查询
适合单值精确匹配一般

所以数据库默认使用 B+ Tree,除非你明确需要 Hash 特性。


🎯 五、最左前缀原则(复合索引的核心)

复合索引只能使用“最左边开始的连续字段”进行查询。

比如创建索引 (a, b, c),下面哪些查询能用上这个索引?

查询条件是否命中索引
WHERE a = 1
WHERE a = 1 AND b = 2
WHERE a = 1 AND b = 2 AND c = 3
WHERE b = 2
WHERE b = 2 AND c = 3
WHERE a = 1 AND c = 3❌(中间断了)

⚠️ 六、常见面试陷阱 + 实战优化建议

❌ 1. where 后用了函数

WHERE DATE(create_time) = '2023-04-10';

这会让索引失效,应该改为:

WHERE create_time BETWEEN '2023-04-10 00:00:00' AND '2023-04-10 23:59:59';

❌ 2. 使用 %like% 造成索引失效

WHERE name LIKE '%张%'

会导致全表扫描,建议改为全文索引或前缀匹配:

WHERE name LIKE '张%'

✅ 3. 尽量避免在查询中使用 OR

WHERE a = 1 OR b = 2

可能导致两个字段的索引都失效,建议拆成 UNION 查询。


📈 七、索引优化建议总结

建议说明
只给高频查询字段加索引避免冗余索引
使用复合索引替代多个单列索引能大幅提升查询效率
保持索引字段的选择性高选择性高 = 唯一值多,过滤效果好
定期分析慢查询日志判断是否需要建立新索引
删除不再使用或重复的索引减少写入负担

📊 额外加餐:索引与事务的关系(关联知识)

  • 索引可以加速事务中的查询与更新
  • 过多索引会增加事务写入时的锁开销
  • 在使用 RR(可重复读)隔离级别时,InnoDB 会使用 间隙锁(gap lock),而索引设计会直接影响锁粒度和性能

✅ 总结一句话:

索引设计,是数据库性能优化的第一战线。用好了像火箭,用错了像拖拉机。

相关文章:

数据库索引深度解析:原理、类型与高效使用实践

🧠 一句话理解索引是什么? 索引就是数据库中的“目录”或“书签”,它能帮助我们快速找到数据的位置,而不是一页页地翻整本书。 🧩 一、为什么需要索引?(用生活化例子秒懂) 想象你在…...

React 记账本项目实战:多页面路由、Context 全局

在本文中,我们将分享一个使用 React 开发的「记账本」项目的实战经验。该项目通过 VS Code 完成,包含首页、添加记录页、编辑页等多个功能页面,采用了 React Router 实现路由导航,使用 Context API 管理全局的交易记录状态,并引入数据可视化组件呈现不同月份的支出情况。项…...

易路iBuilder智能体平台:人力资源领域AI落地,给“数据权限管控”一个最优解

近日,加拿大电子商务巨头Shopify的CEO Tobias Ltke分享了一份内部备忘录,明确表示有效使用AI已成为公司对每位员工的基本期望,并指出:各团队在招募新员工前,必须先确定是否能够利用AI完成工作。 而在全球范围内&#…...

【3】k8s集群管理系列--包应用管理器helm之chart资源打包并推送到harbor镜像仓库

一、chart资源打包 helm package ./web-chart # 当前目录会生成一个tgz的压缩文件二、安装help push插件(用于推送前面打包的文件,到镜像仓库) .1 下载help-push二进制文件 wget https://github.com/chartmuseum/helm-push/releases/down…...

用 Python 从零构建异步回显服务器

简介 让我们从 0 开始,搭建一个异步服务输出服务器。 套接字 套接字(socket),是不同计算机中实现通信的一种方式,你可以理解成一个接口,它会在客户端和服务端建立连接,一台发送数据&#xff…...

mybatis--多对一处理/一对多处理

多对一处理(association) 多个学生对一个老师 对于学生这边,关联:多个学生,关联一个老师[多对一] 对于老师而言,集合,一个老师有多个学生【一对多】 SQL: 测试环境搭建 1.导入依…...

QT Sqlite数据库-教程002 查询数据-上

【1】DQL语句: DQL语句(数据查询语言),用来查询数据记录。DQL 基本结构由 SELECT FROM、WHERE、JOIN 等子句构成。DQL 语句并不会改变数据库,而是让数据库将查询结果发送结果集给客户端,返回的结果是一张虚…...

Kubernetes Operator 是什么,以及它们的用途

最近一个朋友问我关于EKS的升级问题: 场景: 如果我有 100 个 EKS 集群需要升级,那么所有集群都安装了安全插件。由于我不想在升级后手动在每个EKS中重复安装此插件,如何实现EKS升级后自动安装这个安全插件? 答案有多…...

鸿蒙开发08-泛型类型和函数

泛型类型和函数允许创建的代码在各种类型上运行&#xff0c;而不仅支持单一类型&#xff0c;类型参数是一种特殊的变量&#xff0c;它代表类型而不是值。 泛型函数的基本语法如下&#xff1a; function 函数名<类型参数>(参数: 类型参数): 类型参数 {// 函数体return 参…...

C语言十大经典数学应用

C语言在解决数学问题方面非常有用&#xff0c;因为它提供了丰富的数学函数和运算符。以下是一些经典的C语言数学题&#xff0c;这些题目可以帮助你提高编程和数学能力。 1. 计算圆的面积 给定圆的半径&#xff0c;计算圆的面积。 #include <stdio.h> #include <mat…...

计算机视觉——图像金字塔与目标图像边缘检测原理与实践

一、两个图像块之间的相似性或距离度量 1.1 平方差和&#xff08;SSD&#xff09; 平方差和&#xff08;SSD&#xff09; 是一种常用的图像相似性度量方法。它通过计算两个图像在每个对应位置的像素值差的平方和来衡量两个图像之间的整体差异。如果两个图像在每个位置的像素值…...

VRoid-Blender-Unity个人工作流笔记

流程 VRoid 选配模型>减面、减材质>导出vrm Blender&#xff08;先有CATS、vrm插件&#xff09; 导入vrm>Fix model>修骨骼>导出fbx Unity 找回贴图、改着色器、调着色器参数…… VRoid 减面 以模型不出现明显棱角为准。脸好像减面100也问题不大。 下…...

Domain Adaptation领域自适应

背景与问题定义 传统监督学习假设&#xff1a;训练集与测试集数据分布一致。 Domain Shift&#xff1a;测试数据分布与训练数据不同&#xff0c;模型泛化性能骤降 。 例如在黑白图像上训练数字分类器&#xff0c;测试时用彩色图像&#xff0c;准确率骤降。 Domain Adaptatio…...

从自动测量、8D响应到供应链协同的全链路质量管理数字化方案——全星QMS如何破解汽车行业质量困局

全星QMS如何破解汽车行业质量困局&#xff1a;从自动测量、8D响应到供应链协同的全链路数字化方案 在当今竞争激烈的市场环境中&#xff0c;企业要想脱颖而出&#xff0c;必须确保产品质量的稳定性和可靠性。 全星质量QMS软件系统凭借其强大的功能和灵活的架构&#xff0c;为企…...

UNITY 屏幕UI自适应

1.主要就是根据屏幕的选择根据尺寸 和UI的锚点和中心点来选择&#xff0c;也可以通过代码来动态修改 2.参考视频&#xff1a;Unity UGUI屏幕自适应看这个就够了_哔哩哔哩_bilibili...

【信息系统项目管理师】高分论文:论信息系统项目的范围管理(投资信息化全流程管理项目)

更多内容请见: 备考信息系统项目管理师-专栏介绍和目录 文章目录 1、规划范围管理2、收集需求3、定义范围4、创建wbs5、确认范围6、控制范围2018年2月,我有幸参加了 XX省自贸区财政投资信息化全流程管理项目的假设,作为项目发起单位,省自贸办经过审时度势,及时响应国家自贸…...

联想电脑开机出现Defalut Boot Device Missing or Boot Failed怎么办

目录 一、恢复bios默认设置 二、关机重启 三、“物理”方法 在图书馆敲代码时&#xff0c;去吃了午饭回来发现刚开机就出现了下图的问题&#xff08;崩溃&#xff09;&#xff0c;想起之前也发生过一次 这样的问题&#xff0c;现在把我用到的方法写在下面&#xff0c;可能对…...

newbee商城购物车模块mapper.xml

1.浏览代码 1&#xff09;表 自定义 DROP TABLE IF EXISTS tb_newbee_mall_shopping_cart_item; CREATE TABLE tb_newbee_mall_shopping_cart_item (cart_item_id bigint(20) NOT NULL AUTO_INCREMENT COMMENT 购物项主键id,user_id bigint(20) NOT NULL COMMENT 用户主键id…...

SQL学习笔记-聚合查询

非聚合查询和聚合查询的概念及差别 1. 非聚合查询 非聚合查询&#xff08;Non-Aggregate Query&#xff09;是指不使用聚合函数的查询。这类查询通常用于从表中检索具体的行和列数据&#xff0c;返回的结果是表中的原始数据。 示例 假设有一个名为 employees 的表&#xff…...

【Vue 3 + Element Plus 实现产品标签的动态添加、删除与回显】

&#x1f680;Vue 3 Element Plus 实现产品标签的动态添加、删除与回显 在后台管理系统中&#xff0c;我们经常需要对表单数据进行动态处理&#xff0c;尤其是类似“产品标签”这样的字段&#xff0c;它需要用户能够灵活添加、删除&#xff0c;并在编辑时自动回显。今天我们就…...

【NLP】23.小结:选择60题

Question 1: What does the fixed lookup table in traditional NLP represent? A. A table of one‐hot vectors B. A table of pre‐trained dense word embeddings C. A dictionary of word definitions D. A table of n-gram counts Answer (中文): 答案选 B。传统NLP中“…...

IntelliJ 配置(二)配置相关类库(2)LineMarkerProvider

一、介绍 LineMarkerProvider 是 IntelliJ 平台插件开发中的一个接口&#xff0c;它的作用是在编辑器左侧的“行标记区域”&#xff08;就是代码行号左边那一栏&#xff09;添加各种图标、标记或导航链接。比如Java 类中看到的&#xff1a; 小绿色三角形&#xff08;可以点击运…...

从零开始学java--线性表

数据结构基础 目录 数据结构基础 线性表 顺序表 链表 顺序表和链表的区别&#xff1a; 栈 队列 线性表 线性表&#xff08;linear list&#xff09;是n个具有相同特性的数据元素的有限序列。 线性表中的元素个数就是线性表的长度&#xff0c;表的起始位置称为表头&am…...

AD917X系列JESD204B MODE7使用

MODE7特殊在F8&#xff0c;M4使用2个复数通道 CH0_NCO10MHz CH1_NCO30MHZ DP_NCO50MHz DDS1偏移20MHz DDS2偏移40MHz...

Spring Cloud之远程调用OpenFeign最佳实践

目录 OpenFeign最佳实践 问题引入 Feign 继承方式 创建Module 引入依赖 编写接口 打Jar包 服务提供方 服务消费方 启动服务并访问 Feign 抽取方式 创建Module 引入依赖 编写接口 打Jar包 服务消费方 启动服务并访问 服务部署 修改pom.xml文件 观察Nacos控制…...

【Python爬虫】详细入门指南

目录 一、简单介绍 二、详细工作流程以及组成部分 三、 简单案例实现 一、简单介绍 在当今数字化信息飞速发展的时代&#xff0c;数据的获取与分析变得愈发重要&#xff0c;而网络爬虫技术作为一种能够从互联网海量信息中自动抓取所需数据的有效手段&#xff0c;正逐渐走入…...

Win11系统 VMware虚拟机 安装教程

Win11系统 VMware虚拟机 安装教程 一、介绍 Windows 11是由微软公司&#xff08;Microsoft&#xff09;开发的操作系统&#xff0c;应用于计算机和平板电脑等设备 。于2021年6月24日发布 &#xff0c;2021年10月5日发行 。 Windows 11提供了许多创新功能&#xff0c;增加了新…...

打造AI应用基础设施:Milvus向量数据库部署与运维

目录 打造AI应用基础设施&#xff1a;Milvus向量数据库部署与运维1. Milvus介绍1.1 什么是向量数据库&#xff1f;1.2 Milvus主要特点 2. Milvus部署方案对比2.1 Milvus Lite2.2 Milvus Standalone2.3 Milvus Distributed2.4 部署方案对比表 3. Milvus部署操作命令实战3.1 Milv…...

对于客户端数据存储方案——SQLite的思考

SQLite 比较适合进行本地小型数据的存储&#xff0c;在功能丰富性和并发能力上不如 MySQL。 数据类型差异 SQLite 使用动态类型系统&#xff1a;只有 5 种基本存储类 (NULL, INTEGER, REAL, TEXT, BLOB) 类型亲和性&#xff1a;SQLite 会将声明的列类型映射到最接近的存储类 …...

【深度学习与大模型基础】第11章-Bernoulli分布,Multinoulli分布

一、Bernoulli分布 1. 基本概念 想象你抛一枚硬币&#xff1a; 正面朝上&#xff08;记为 1&#xff09;概率是 p&#xff08;比如 0.6&#xff09;。 反面朝上&#xff08;记为 0&#xff09;概率是 1-p&#xff08;比如 0.4&#xff09;。 这就是一个Bernoulli分布&…...