当前位置：首页 > news >正文

MySQL进阶-关联查询优化

news 2026/5/16 8:32:41

采用左外连接

下面开始 EXPLAIN 分析

EXPLAIN SELECT SQL_NO_CACHE * FROM `type` LEFT JOIN book ON type.card = book.card;

结论：type 有All ,代表着全表扫描，效率较差

添加索引优化

ALTER TABLE book ADD INDEX Y ( card); #【被驱动表】，可以避免全表扫描
EXPLAIN SELECT SQL_NO_CACHE * FROM `type` LEFT JOIN book ON type.card = book.card;

可以看到第二行的 type 变为了 ref，rows 也变成了优化比较明显。这是由左连接特性决定的。LEFT JOIN 条件用于确定如何从右表搜索行，左边一定都有，所以 右边是我们的关键点,一定需要建立索引 。 也就是left join 右边所关联的表的关联字段一定要建立索引。

只是对左边的表建立索引的话，是没有效果的，可以通过rows这一列看到，type表要读取的记录仍然是20条。

ALTER TABLE `type` ADD INDEX X (card); #【驱动表】，无法避免全表扫描
EXPLAIN SELECT SQL_NO_CACHE * FROM `type` LEFT JOIN book ON type.card = book.card;

把右边的表的索引删除，可以发现现在又要走全表扫描了

DROP INDEX Y ON book;
EXPLAIN SELECT SQL_NO_CACHE * FROM `type` LEFT JOIN book ON type.card = book.card;

采用内连接

删除先前的索引

drop index X on type;
drop index Y on book;（如果已经删除了可以不用再执行该操作）

换成 inner join（MySQL自动选择驱动表）

EXPLAIN SELECT SQL_NO_CACHE * FROM type INNER JOIN book ON type.card=book.card;

添加索引优化

向book表添加索引后，book自动成为被驱动表，提高了查询效率。

ALTER TABLE book ADD INDEX Y (card);
EXPLAIN SELECT SQL_NO_CACHE * FROM type INNER JOIN book ON type.card=book.card;

如果新增了type表的索引，此时两个表都有索引，优化器会选择小数据量的表作为驱动表，用来驱动大表。

ALTER TABLE type ADD INDEX X (card);
EXPLAIN SELECT SQL_NO_CACHE * FROM type INNER JOIN book ON type.card=book.card;

对于内连接来说，查询优化器可以决定谁作为驱动表，谁作为被驱动表出现的，接下来把type表的索引删了。可以看到有索引的book表又作为了被驱动表

DROP INDEX X ON `type`;
EXPLAIN SELECT SQL_NO_CACHE * FROM TYPE INNER JOIN book ON type.card=book.card;

向type表里面添加索引，此时又变成了被驱动表了

ALTER TABLE `type` ADD INDEX X (card);
EXPLAIN SELECT SQL_NO_CACHE * FROM `type` INNER JOIN book ON type.card=book.card;

join语句原理

join方式连接多个表，本质就是各个表之间数据的循环匹配。MySQL5.5版本之前，MySQL只支持一种表间关联方式，就是嵌套循环(Nested Loop Join)。如果关联表的数据量很大，则join关联的执行时间会很长。在MySQL5.5以后的版本中，MySQL通过引入BNLJ算法来优化嵌套执行。

驱动表和被驱动表

驱动表就是主表，被驱动表就是从表、非驱动表。

对于内连接来说：

A一定是驱动表吗？不一定，优化器会根据你查询语句做优化，决定先查哪张表。先查询的那张表就是驱动表，反之就是被驱动表。通过explain关键字可以查看。

SELECT * FROM A JOIN B ON ...

对于外连接来说：

SELECT * FROM A LEFT JOIN B ON ...
# 或
SELECT * FROM B RIGHT JOIN A ON ...

Simple Nested-Loop Join (简单嵌套循环连接)

算法相当简单，从表A中取出一条数据1，遍历表B，将匹配到的数据放到result.. 以此类推，驱动表A中的每一条记录与被驱动表B的记录进行判断：

可以看到这种方式效率是非常低的，以上述表A数据100条，表B数据1000条计算，则A*B=10万次。开销统计如下。当然mysql肯定不会这么粗暴的去进行表的连接，所以就出现了后面的两种对Nested-Loop Join优化算法。

Index Nested-Loop Join （索引嵌套循环连接）

Index Nested-Loop Join其优化的思路主要是为了减少内存表数据的匹配次数，所以要求被驱动表上必须有索引才行。通过外层表匹配条件直接与内层表索引进行匹配，避免和内存表的每条记录去进行比较，这样极大的减少了对内存表的匹配次数。就是利用索引来提高匹配效率

驱动表中的每条记录通过被驱动表的索引进行访问，因为索引查询的成本是比较固定的，故mysql优化器都倾向于使用记录数少的表作为驱动表（外表）。如果被驱动表加索引，效率是非常高的，但如果索引不是主键索引，所以还得进行一次回表查询。相比，被驱动表的索引是主键索引，效率会更高。

Block Nested-Loop Join（块嵌套循环连接）

之前是将驱动表逐条与非驱动表的记录进行匹配，现在是引入join buffer缓冲区，将驱动表的记录缓冲到缓冲区，然后进行批量匹配，而不是逐条匹配。

Join小结

1、整体效率比较：INLJ > BNLJ > SNLJ

2、永远用小结果集驱动大结果集（其本质就是减少外层循环的数据数量）（小的度量单位指的是表行数 * 每行大小）
select t1.b,t2.* from t1 straight_join t2 on (t1.b=t2.b) where t2.id<=100; # 推荐
select t1.b,t2.* from t2 straight_join t1 on (t1.b=t2.b) where t2.id<=100; # 不推荐
3、为被驱动表匹配的条件增加索引(减少内存表的循环匹配次数)

4、增大join buffer size的大小（一次索引的数据越多，那么内层包的扫描次数就越少）

5、减少驱动表不必要的字段查询（字段越少，join buffer所缓存的数据就越多）

Hash Join

从MySQL的8.0.20版本开始将废弃BNLJ，因为从MySQL8.0.18版本开始就加入了hash join默认都会使用hash join

Nested Loop:

对于被连接的数据子集较小的情况，Nested Loop是个较好的选择。

Hash Join是做大数据集连接时的常用方式，优化器使用两个表中较小（相对较小）的表利用Join Key在内存中建立散列表，然后扫描较大的表并探测散列表，找出与Hash表匹配的行。

这种方式适合于较小的表完全可以放于内存中的情况，这样总成本就是访问两个表的成本之和。

在表很大的情况下并不能完全放入内存，这时优化器会将它分割成若干不同的分区，不能放入内存的部分就把该分区写入磁盘的临时段，此时要求有较大的临时段从而尽量提高I/O的性能。

它能够很好的工作于没有索引的大表和并行查询的环境中，并提供最好的性能。大多数人都说它是Join的重型升降机。Hash Join只能应用于等值连接（如WHERE A.COL1 = B.COL2），这是由Hash的特点决定的。

小结

保证被驱动表的JOIN字段已经创建了索引

需要JOIN 的字段，数据类型保持绝对一致。

LEFT JOIN 时，选择小表作为驱动表，大表作为被驱动表。减少外层循环的次数。

INNER JOIN 时，MySQL会自动将 小结果集的表选为驱动表 。选择相信MySQL优化策略。

能够直接多表关联的尽量直接关联，不用子查询。(减少查询的趟数)

不建议使用子查询，建议将子查询SQL拆开结合程序多次查询，或使用 JOIN 来代替子查询。

衍生表建不了索引

MySQL进阶-关联查询优化

采用左外连接下面开始 EXPLAIN 分析 EXPLAIN SELECT SQL_NO_CACHE * FROM type LEFT JOIN book ON type.card book.card; 结论：type 有All ,代表着全表扫描，效率较差添加索引优化 ALTER TABLE book ADD INDEX Y ( card); #【被驱动表】&#xff0…...

编程日记 2025/3/9 6:34:01

数据结构第六节：二叉搜索树（BST）的基本操作与实现

【本节要点】二叉搜索树（BST）基本原理代码实现核心操作实现辅助函数测试代码完整代码一、二叉搜索树（BST）基本原理与设计总结注：基本原理的详细分析可以在数据结构第六节中查看，这里是简单描述。二叉搜…...

编程日记 2025/3/9 6:31:59

在昇腾GPU上部署DeepSeek大模型与OpenWebUI：从零到生产的完整指南

引言随着国产AI芯片的快速发展，昇腾（Ascend）系列GPU凭借其高性能和兼容性，逐渐成为大模型部署的重要选择。本文将以昇腾300i为例，手把手教你如何部署DeepSeek大模型，并搭配OpenWebUI构建交互式界面。无论…...

编程日记 2025/3/9 6:29:57

在window终端创建docker容器的问题

问题： 错误原因： PowerShell 换行符错误 PowerShell 中换行应使用反引号而非反斜杠 \，错误的换行符导致命令解析中断。在 Windows 的 PowerShell 中运行 Docker 命令时遇到「sudo 无法识别」的问题，这是因为 Windows 系统原生不…...

编程日记 2025/3/9 6:27:54

掌握Kubernetes Network Policy,构建安全的容器网络

在 Kubernetes 集群中，默认情况下，所有 Pod 之间都是可以相互通信的，这在某些场景下可能会带来安全隐患。为了实现更精细的网络访问控制，Kubernetes 提供了 Network Policy 机制。Network Policy 允许我们定义一组规则&#xff0c…...

编程日记 2025/3/9 6:24:52

ReAct论文阅读笔记总结

ReAct：Synergizing Reasoning and Acting in Language Models 背景最近的研究结果暗示了在自主系统中结合语言推理与交互决策的可能性。一方面，经过适当Prompt的大型语言模型（LLMs）已经展示了在算术、常识和符号推理任务中通…...

编程日记 2025/3/9 6:23:51

1. 做三个节点的redis集群。 1、编辑redis节点node0(10.0.0.100)、node1(10.0.0.110)、node2(10.0.0.120)的安装脚本 [rootnode0 ~]# vim install_redis.sh#!/bin/bash # 指定脚本解释器为bashREDIS_VERSIONredis-7.2.7 # 定义Redis的版本号PASSWORD123456 # 设置Redis的访问…...

编程日记 2025/3/9 6:22:50

Python在数字货币交易中的算法设计：从策略到实践

Python在数字货币交易中的算法设计：从策略到实践随着区块链技术的发展和加密货币市场的繁荣，数字货币交易已经成为金融领域的一个重要分支。从个体投资者到量化基金，算法交易（Algorithmic Trading）正在为提高交易效率和决策质量提供强大的支撑。在这些技术应用中，Pytho…...

编程日记 2025/3/9 6:21:49

高纬度、跨极区导航技术

本文是何昆鹏老师所写，在此非常感谢何老师的分享。全球导航，特别是极区导航，一直被美俄导航领域所关注。美俄本身部分国土就处于极区，很多战略军事部署与全球航线也都处于该区域，加之其战略军事任务也都强调全球覆盖…...

编程日记 2025/3/9 6:20:48

用AI学编程2——python学习1

一个py文件，学会所有python所有语法和特性，给出注释，给出这样的文件 Python 学习整合文件 """ Python 学习整合文件包含 Python 的基础语法、数据结构、函数定义、面向对象编程、异常处理、文件操作、高级特性等内容每个部…...

编程日记 2025/3/9 6:18:46

用数据唤醒深度好眠，时序数据库 TDengine 助力安提思脑科学研究

在智能医疗与脑科学快速发展的今天，高效的数据处理能力已成为突破创新的关键。安提思专注于睡眠监测与神经调控，基于人工智能和边缘计算，实现从生理体征监测、智能干预到效果评估的闭环。面对海量生理数据的存储与实时计算需求，安…...

编程日记 2025/3/9 6:17:44

Ubuntu下MySQL的安装与使用（一）

目录用户切换 MySQL的安装 MySQL的初步使用登录与退出 Linux和mysql中的普通用户和root用户查看、创建与使用简单应用 MySQL 数据库在 Linux 文件系统中的存储结构数据库、数据库服务、数据库管理系统（宏观） 微观下的DBMS SQL语言及其分…...

编程日记 2025/3/9 6:16:43

步进电机软件细分算法解析与实践指南

1. 步进电机细分技术概述步进电机是一种将电脉冲信号转换为角位移的执行机构，其基本运动单位为步距角。传统步进电机的步距角通常为 1.8（对应 200 步 / 转），但在高精度定位场景下，这种分辨率已无法满足需求。细分技术…...

编程日记 2025/3/9 6:14:41

pytorch retain_grad vs requires_grad

requires_grad大家都挺熟悉的，因此穿插在retain_grad的例子里进行捎带讲解就行。下面看一个代码片段： import torch# 创建一个标量 tensor，并开启梯度计算 x torch.tensor(2.0, requires_gradTrue)# 中间计算：y 依赖于 x&#x…...

编程日记 2025/3/9 6:13:39

RabbitMQ消息队列中间件安装部署教程（Windows）-2025最新版详细图文教程（附所需安装包）

目录前言一、安装Erlang环境 1、下载Erlang安装包 2、安装Erlang 3、设置环境变量二、安装RabbitMQ环境 1、下载RabbitMQ安装包 2、安装RabbitMQ 3、设置环境变量三、启动RabbitMQ 1、开启RabbitMQ管理插件 2、启动RabbitMQ 四、访问RabbitMQ 前言 RabbitMQ 是…...

编程日记 2025/3/9 6:12:38

vue-cli3+vue2+elementUI+avue升级到vite+vue3+elementPlus+avue总结

上一个新公司接手了一个vue-cli3vue2vue-router3.0elementUI2.15avue2.6的后台管理项目，因为vue2在2023年底已经不更新维护了，elementUI也只支持到vue2，然后总结了一下vue3的优势，最后批准升级成为了vitevue3vue-router4.5element…...

编程日记 2025/3/9 6:11:37

车载以太网测试-3【Wireshark介绍】

1 摘要 Wireshark 是一款开源的网络协议分析工具，广泛用于网络故障排查、协议分析、网络安全检测等领域。它能够捕获网络数据包，并以详细的、可读的格式显示这些数据包的内容。广泛应用于车载网络测试，是车载网络测试工程师必须掌握的工具。…...

编程日记 2025/3/9 6:10:36

扫雷雷雷雷雷雷雷

大家好啊，我是小象٩(๑ω๑)۶ 我的博客：Xiao Xiangζั͡ޓއއ 很高兴见到大家，希望能够和大家一起交流学习，共同进步。这一节课我们不学习新的知识，我们来做一个扫雷小游戏目录扫雷小游戏概述一、扫雷游戏分析…...

编程日记 2025/3/9 6:07:31

图片分类实战：食物分类问题（含半监督）

食物分类问题 simple_class 1. 导入必要的库和模块 import random import torch import torch.nn as nn import numpy as np import os from PIL import Image #读取图片数据 from torch.utils.data import Dataset, DataLoader from tqdm import tqdm from torchvision impo…...

编程日记 2025/3/9 6:06:30

RuoYi框架添加自己的模块（学生管理系统CRUD）

RuoYi框架添加自己的模块（学生管理系统） 框架顺利运行首先肯定要顺利运行框架了，这个我不多说了设计数据库表在ry数据库中添加表tb_student 表字段如图所示如图所示注意id字段是自增的注释部分是后面成功后前端要展示的部分导入…...

编程日记 2025/3/9 6:04:28

从限速到全速：ctfileGet如何彻底改变城通网盘下载体验

从限速到全速：ctfileGet如何彻底改变城通网盘下载体验【免费下载链接】ctfileGet 获取城通网盘一次性直连地址项目地址: https://gitcode.com/gh_mirrors/ct/ctfileGet 清晨的阳光透过窗户洒在设计师小李的电脑屏幕上，他正焦急地等待着一个500M…...

编程新知 2026/5/16 8:29:53

小学生如何学好GESP

一、按年龄段科学规划学习路径 ‌1. 6–9岁（小学低年级）：重在逻辑启蒙，不急于学代码‌ A、‌核心任务‌：培养‌计算思维、问题拆解、条件判断‌等能力。 B、‌推荐方式‌： （1）、…...

编程新知 2026/5/16 8:29:52

Go语言模板方法模式：算法骨架

Go语言模板方法模式：算法骨架 1. 模板方法实现 type AbstractClass struct{}func (a *AbstractClass) TemplateMethod() {a.Step1()a.Step2()a.Step3() }func (a *AbstractClass) Step1() {} func (a *AbstractClass) Step2() {} func (a *AbstractClass) Step3() {…...

编程新知 2026/5/16 8:21:11

大语言模型智能体长期记忆解决方案：LightMem架构解析与LangChain实战

1. 项目概述：轻量化记忆增强的智能体新范式最近在探索大语言模型智能体应用时，一个核心痛点始终绕不开：如何让智能体在长对话或多轮任务中，记住关键信息，并做出连贯、精准的决策？传统的做法要么是将整个对话…...

编程新知 2026/5/16 8:17:06

2026年5月14隔夜暗盘挂单排行榜

推荐好文:每年节约五六千交易费不香吗如何获取龙虎榜是否有量化参与如何获取股东减持信息大A有5400多只股票, 这里面只有不到10%, 约500只由资金投票, 剩余的都是杂毛, 炒股看龙头找主线. 从隔夜挂单里选择, 再叠加我们之前分享的如何判断是否有大股东减持, 是否有融资融券参与…...

编程新知 2026/5/16 8:02:03

RAG已死？收藏这篇，小白程序员必看：上下文工程才是大模型未来！

本文探讨了围绕RAG技术的争议，分析了三种不同观点：RAG正进化为更智能的检索系统、RAG已成为核心工程学科、RAG正被长上下文和智能体取代。文章指出，简单的RAG已过时，但提供外部知识的需求依然存在，未来RAG将作为组件之…...

编程新知 2026/5/16 7:00:53

从零构建卡组构筑器：React+TS实战与复杂状态管理解析

1. 项目概述：从零构建一个卡组构筑器最近在GitHub上看到一个挺有意思的项目，叫guladam/deck_builder_tutorial。光看名字，很多朋友可能第一反应是“哦，一个教你怎么做卡组构筑器的教程”。但如果你真的点进去，或者像我…...

编程新知 2026/5/16 6:58:49

AI编程也开始“贵价提速”？Cursor上线Opus极速模式，官方却劝你：别开，真不值！

前言各位码农老铁们，最近有没有感觉写代码像在开手动挡老爷车——油门踩到底，AI还在“思考人生”？别急，Cursor贴心地给你装了个“涡轮增压”：Claude Opus 4.7 Fast mode，号称速度拉满、输出飞起&#xff01…...

编程新知 2026/5/16 5:57:10

开源APM探针bee-apm：无侵入式Java应用性能监控与链路追踪实战

1. 项目概述：从“蜜蜂”视角重新审视应用性能在分布式系统和微服务架构成为主流的今天，一个用户请求的背后，可能串联着十几个甚至几十个不同的服务。当线上出现一个性能瓶颈或一个诡异的错误时，定位问题的过程就像在漆黑的迷宫里寻…...

编程新知 2026/5/16 4:59:02

Adafruit Bluefruit LE模块AT命令实战：从BLE透传到Eddystone信标与HID设备开发

1. 项目概述与核心价值如果你正在开发一个需要无线连接功能的物联网设备、可穿戴设备或者创意交互项目，那么蓝牙低功耗（BLE）技术几乎是一个绕不开的选择。它功耗低、连接快，并且被现代智能手机和电脑广泛支持。然而，直…...

编程新知 2026/5/16 4:56:58