MySQL InnoDB存储引擎
MySQL InnoDB存储引擎
InnoDB 存储引擎的优点:由于 InnoDB 存储引擎存储的数据量大,性能高,可以有效的保证数据安全等优点,在 MySQL 5.5 后称为了默认的存储引擎。
InnoDB 内存结构: 缓冲池(buffer poll) 变更缓冲池(Change Buffer) 日志缓冲区(Log Buffer) 自适应哈希(Adaptive Hash Index)
缓冲池作用:内存中主要工作区域,优化查询性能 变更缓冲区作用:优化修改操作的性能 日志缓冲区作用: 自适应哈希作用:进一步提升查询的性能
磁盘结构中包括: 系统表空间: 独立表空间: 通用表空间: 临时表空间: 撤销表空间: 重做日志: 双写缓冲区:
以上这些都是保存的是真是的数据。
InnoDB 为什么要设计成内存和磁盘两个部分: 因为真实的数据需要保存在磁盘里, 但是磁盘的速度是比较慢的,而严重影响数据库整体的性能,而影响应用程序的性能,所以我们需要将常用的数据放在内存中,提示查询速率,但是内存中的数据是易失的,所以可以将常用的数据缓存在内存里,当第二次查询同样的数据,那么就可以将缓存的数据直接返回给客户端。所以磁盘是用来持久化的,而内存是用来缓存提高效率的。
使用 InnoDB 存储引擎创建的表对应的数据文件在哪里: 1.数据目录所在的路径 当创建一个数据库时,会在数据目录生成一格与数据库同名的子目录,数据库同名的子目录中保存的是表对应的数据文件
MySQL 存储结构: MySQL为了有效的维护数据而定义的一系列数据结构
什么是表空间文件: 表空间文件就是用来存储数据的文件,表空间文件的大小由存储的数据多少决定的,不同的表空间文件存储的种类也是有所不同的,在MySQL 中表空间分为五类,系统表空间,独立表空间,通用表空间,临时表空间,撤销表空间。
表空间和表空间文件的关系: 对于使用者而言,表空间,表空间文件,数据文件,是一个东西。而表空间就是设计层面上的,而表空间文件就是实际层面的,以文件的形式存在在次磁盘上面。
用户数据在表空间中是如何存储的: 想要搞清楚用户的数据在表空间中是如何存储的,实际上我们只需要知道 MySQL 的存储结构是如何定义的,其实这两个就是一个问题。 首先我们知道,用户的数据是以数据行的方式存储在对应的表空间文件中的,所以我们就需要对表空间文件中的数据行进行管理,而为了方便管理,表空间是由,段,区组,区,页,数据行,组成的,其中页是 InnoDB 中磁盘管理的最小单位。
为什么使用页这个数据管理单元: MySQL 是一个应用程序,它是运行在操作系统上的,而 MySQL 不论是数据的存储还是查询,实际上都是需要经过磁盘的,而磁盘作为硬件应用程序并不能直接访问,所以需要通过操作系统,而所以MySQL读取或者是写入都是需要经过操作系统的,但是操作系统一次性读取次磁盘都是最小4k,而MySQL为了一次性读取更多的数据,自己定义了一个数据结构页,一次是16k,而 MySQL 的在读取或者写入的时候大量的时间都是消耗在了磁盘的IO上,但是如果一次性读取16k的话,根据局部性原原理,大概率下一次访问的数据也在这一次读取的数据中,所以下一次就不需要继续访问磁盘了,这样也就提高了MySQL的整体性能。
局部性原理: 程序在执行的时候呈现的局部性规律,整个程序在执行的过程中,在一段时间内大概只执行该程序的的某一部分,而局部性原原理通常有两种形式:时间和空间局部性 时间局部性就是一个信息在被访问的时候,那么大概率在这段时间内会被一直访问。 空间局部性就是正在访问的数据可能就是下一次访问数据的地址空间是相近的。
页结构: MySQL 中有许多不同类型的页,但是每一种页都会包含页头, 页尾, 在页头,页尾之间的页主体信息根据不同的类型有不同的结构,最常见的就是用来存储数据和索引的“索引页”,也叫做 “数据页”,页的注意信息使用数据行进行填充。
查询的数据超过一页的大小,如何提高查询效率: 1.不同的页在磁盘中是不是连续的: 不一定,在不做任何控制的情况下,不同的页在磁盘中申请的地址大概率是不连续的。
2.为什么不连续的地址会降低查询的效率: 当存储的介质是机械硬盘时,访问不连续的地址会带来磁盘寻址的开销,也就是磁盘的随机访问。 因为在磁盘上,当我们需要访问一个数据的时候,需要先找到对应的磁道,然后在找到对应的扇区,最后才是读取数据,所以磁头的移动是很费时的。
3.如果页不是连续的,对访问效率是否有影响:
4.InnoDB 如何保证页在磁盘中的连续性: 为了解决磁盘的随机访问这个问题,所以需要尽可能的在磁道上读取连续的数据,介绍磁头的移动,MySQL 使用区这个结构来管理页,规定每个区固定为1MB, 可以存放64个页,所以即使跨页读取数据,那么大概率也是在附件的地址。
我们知道 InnoDB 是使用区来组织页的,并且每一个区都是固定大小1MB,可以包括64个页,所以说查询的数据超过1页的时候会有下面的情况 页在区内,并且页相邻:这时候磁盘是顺序IO,大幅的提升磁盘的IO效率 页在区内,但不相邻:这时候可以大量的减少磁头的移动,可以提升效率 页在不同的区内:这种情况是不能提升效率的
区的特点:大小1MB
区和页的关系:区是管理页的,区中包含若干个页,保证区中页的连续性
当表中的数据很少的时候,如何避免空间浪费: 为什么表中数据很少的时候会存在空间的浪费?因为区的特点就是一次申请1MB,那么当新创建的表中,数据的大小不能确定,所以不一定这个表一定可以使用完1MB,所以就会存在空间的浪费。 那么MySQL为了解决这个问题,在刚开始创建的表中实际上只有7页,而不是申请一个完整的区。 刚开始的这些页会放在碎片区,当数据量达到32页的时候,后面的申请就会每次申请一个完整的区。 通过零散页和碎片区来避免空间浪费。
如果访问的数据跨区了,如何提高查询效率: 1.区的偏移量 2.区管理的数据的范围 3.用双向链表把区组织起来 对于区组也需要管理自身的属性 1.区组管理数据的范围 2.用双向链表把区组也组织起来 碎片区作为表空间中的第一个区组中的第一个区,而这个区的前四页,这个是比较特殊的: File Space Header:表空间和区组中的条目信息 Insert Buffer Bitmap: Change Buffer 的相关信息 File Segment inode: 段信息 B-tree Node:索引根信息 其他为空闲也用来保存真实的数据 使用区组结构有效的管理区,每个区组管理256个区也就是256MB, 区组条目的信息会记录在每个区的偏移并用双向链表链接。
上面的数据结构还有优化的空间吗: 上面说的区,区组和页都是物理结构,而在这些物理结构的基础上定义了一个逻辑结构,段。 段可以区分不同功能的区在碎片中的页,并按功能分为叶子节点段和非叶子节点段,作为B+树索引中的叶子和非叶子节点。
上面所有的操作是在哪里进行的: 所有的数据库操作在内存中进行的,当数据处理完毕后又会刷新到磁盘中对应的页上。
查询数据时MySQL会一次性将表中的数据全部加载到内存中吗: 如果将一个表中的全部数据都加载到内存中的话,可能这个表的数据量是比较大的,内存是无法满足表中全部的数据的,所以不会吧表中的数据全部加载到内存中。
没查询一条数据都要进行一次IO吗: 前面我们说了当我们查询数据的时候,我们需要先看一下缓存里面有没有,当缓存里面没有的话才会进行磁盘IO,而每一次的磁盘IO也并不是只加载一条数据行,而是当找到对应的数据行的时候,会将该数据行所在的页全部加载到内存中,所以当我们每次进行查询一条数据的时候,并不一定会每次都进行IO,而且在MySQL中如果当一个区中的页经常被访问的时候,MySQL也会将区中的页加载到内存中,以便于访问。
页大小可以设置吗: 在MySQL中有一个系统变量 innodb_page_size 可以设置页大小,这里建议4kb 的整数倍。
在 MySQL 中有哪些页?我们重点关注哪些: 因为 MySQL 中有许多不同的数据需要存储,所以常见的就有,数据页, Undo Log 页, Change Buffer 页, Extent Descriptor 页, 但是我们最关注的是数据页。在InnoDB 中也可以叫索引页。
相关文章:

MySQL InnoDB存储引擎
MySQL InnoDB存储引擎 InnoDB 存储引擎的优点:由于 InnoDB 存储引擎存储的数据量大,性能高,可以有效的保证数据安全等优点,在 MySQL 5.5 后称为了默认的存储引擎。 InnoDB 内存结构: 缓冲池(buffer poll&…...

无头单向非循环链表实现 and leetcode刷题
无头单向非循环链表实现 1. 单链表的模拟实现IList.java接口:MySingleList.java文件: 2. leetcode刷题2.1 获取链表的中间节点2.2 删除链表中所有值为value的元素2.3 单链表的逆置2.4 获取链表倒数第k个节点2.5 给定 x, 把一个链表整理成前半部分小于 x,…...

Ubuntu系统上安装Apache和WordPress
** 第一步跟新系统包 ** 首先跟新系统包 sudo apt update sudo apt upgrade第二步下载安装apache sudo apt install apache2 ##查看apache的状态是否启动成功 sudo systemctl status apache2 ##查看服务器的ip地址 sudo ip a通过ip地址进行访问apache页面 第三步下载安装…...

Doze和AppStandby白名单配置方法和说明
机制 配置路径 配置案例 说明 影响机制 调试命令 Doze /platform/frameworks/base /data/etc/platform.xml allow-in-power-save 【系统应用Doze白名单配置】 Doze\Job\AppStandby\Alarm\WakeLock\Sync 查看Doze白名单:adb shell dumpsys deviceidle 添加Doze白名单…...

坑2.Date类型的请求参数
前端 <el-form-item label"结束日期" prop"endTime"><el-date-pickerv-model"dataForm.endTime"type"date"value-format"yyyy-MM-dd HH:mm:ss"placeholder"选择日期"></el-date-picker></el…...

javaweb ajax maven mybatis spring springmvc 在项目中有什么用, 举例说明
JavaWeb是一种基于Java语言的Web开发技术,可以用来开发动态网站和Web应用程序。 AJAX(Asynchronous JavaScript and XML)是一种在Web开发中用于实现异步通信的技术,可以在不刷新整个网页的情况下更新部分页面内容,提升…...

Python编程学习笔记(4)--- 字典
目录 1 什么是字典 2 使用字典 2.1 访问字典中的值 2.2 添加键值对 2.3 创建空字典 2.4 修改字典中的值 2.5 删除键值对 2.6 类似键值对组成的字典 2.7 使用get()来访问值 3 遍历字典 3.1 遍历所有键值对 3.2 遍历字典中的所有键 3.3 按照特…...

会员运营体系设计及SOP梳理
一些做会员的经验和方法分享给大家,包括顶层思考、流程的梳理、组织的建立,后续会做成系列,最近几期主要围绕顶层策略方面,以下是核心内容的整理: 1、会员运营体系设计 顶层设计与关键业务定位:建立客户运营…...

SQL 自定义函数
概念 自定义函数是用户根据自己的业务逻辑或计算需求创建的函数。这些函数可以接收一个或多个输入参数,执行一系列的操作(如计算、数据处理、逻辑判断等),并最终返回一个值或结果集。自定义函数可以被多次重用,提高了…...

C# 下sendmessage和postmessage的区别详解与示例
文章目录 1、SendMessage2、PostMessage3、两者的区别: 总结 在C#中,SendMessage和PostMessage是两个用于Windows编程的API,它们用于向窗口发送消息。这两个方法都位于System.Windows.Forms命名空间中,通常用于自动化Windows应用程…...

Transformer重要论文与书籍 - Transformer教程
近年来,人工智能领域中的Transformer模型无疑成为了炙手可热的研究对象。从自然语言处理(NLP)到计算机视觉,Transformer展现出了前所未有的强大能力。今天,我们将探讨Tra在当今的人工智能和机器学习领域,Tr…...

android13 rom 开发总纲说明
1. 这里是文章总纲,可以在这里快速找到需要的文章。 2. 文章一般是基于标准的android13,有一些文章可能会涉及到具体平台,例如全志,瑞芯微等一些平台。 3.系统应用 3.1系统应用Launcher3桌面相关: 3.2系统应用设置S…...

2.线性回归
简化的房价模型 假设1:影响房价的关键因素时卧室个数,卫生间和居住面积,记为 x 1 , x 2 , x 3 x_1,x_2,x_3 x1,x2,x3 假设2:成交价时关键因素的加权和: y w 1 x 1 w 2 x 2 w 3 x 3 b y w_1x_1w_2x_2w_3x…...

一文了解java中Optional
文章目录 1. Optional简介2. 常用的接口2.1 常用接口简单使用2.1.1 创建的常用方法2.1.2 获取值的常用方法2.1.3 判定的常用方法2.1.4 判定后的操作方法2.2 map方法介绍 2.2 其他方法2.2.1 Filter 方法2.2.2 FlatMap 方法 3. 常用的实例4. 总结 1. Optional简介 Optional是在ja…...

提示词工程(Prompt Engineering)是什么?
一、定义 Prompt Engineering 提示词工程(Prompt Engineering)是一项通过优化提示词(Prompt)和生成策略,从而获得更好的模型返回结果的工程技术。 二、System message 系统指令 System message可以被广泛应用在&am…...

vue对axios进行请求响应封装
一、原因 像是在一些业务逻辑上,比如需要在请求之前展示loading效果,或者在登录的时候判断身份信息(token)等信息有没有过期,再者根据服务器响应回来的code码进行相应的提示信息。等等在请求之前,之后做的一…...

快速测试electron环境是否安装成功
快速测试electron环境是否安装成功 测试代码正确运行的效果运行错误的效果v22.4.1 版本无法使用v20.15.1版本无法使用v18.20.4 版本无法使用 终极解决办法 测试代码 1.npx create-electron-app my-electron-app 2.cd my-electron-app 3.npm start 正确运行的效果 环境没问题…...

数电设计提问求帮助,出租车计费器。
🏆本文收录于《CSDN问答解惑-》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&…...

xcode项目添加README.md文件并进行编辑
想要给xcode项目添加README.md文件其实还是比较简单的,但是对于不熟悉xcode这个工具的人来讲,还是有些陌生,下面简单给大家讲一下流程。 选择“文件”>“新建”>“文件”,在其他(滚动到工作表底部)下…...

基于 cookiecutter 的 python 项目模板
Cookiecutter 介绍 使用 Python 这种动态语言进行 web 开发,团队中经常会遇到的问题就是代码的质量比较难控制。Python 语言本身灵活性比较高,不加控制的情况下代码质量可能最后很难维护。而且代码的各方面的标准,比如提示的 lint࿰…...

如何玩转澳大利亚Facebook直播?
近年来,直播带货已经成为国内最赚钱的行业之一,各种玩法也越来越成熟。然而,在海外市场,尤其是澳大利亚,直播带货仍然是一片蓝海。作为社交媒体营销的主阵地,Facebook的直播功能却常常被卖家忽视。那么&…...

C# IOC容器、依赖注入和控制反转
控制反转(Inversion of Control, IoC) 定义:控制反转是一种设计原则,它反转了传统编程中的控制流程。在传统的编程模式中,组件之间的依赖关系是由组件自身在内部创建和维护的。而在控制反转模式中,这种依赖…...

论文学习_An Empirical Study of Deep Learning Models for Vulnerability Detection
1. 引言 研究背景:近年来,深度学习漏洞检测工具取得了可喜的成果。最先进的模型报告了 0.9 的 F1 分数,并且优于静态分析器。结果令人兴奋,因为深度学习可能会给软件保障带来革命性的变化。因此,IBM、谷歌和亚马逊等行业公司非常感兴趣,并投入巨资开发此类工具和数据集。…...

ctfshow-web入门-文件上传(web166、web167)(web168-web170)免杀绕过
目录 1、web166 2、web167 3、web168 4、web169 5、web170 1、web166 查看源码,前端只让传 zip 上传 zip 成功后可以进行下载 随便搞一个压缩包,使用记事本编辑,在其内容里插入一句话木马: 上传该压缩包,上传成功…...

Jitsi Meet指定用户成为主持人
前言 在Jitsi Meet进行会议的时候,我们有可能会使用到预约会议的这一个功能,预约会议的时候,我们希望我预约的会议,我就是主持人,而不希望其他人是主持人。 但是Jitsi Meet默认会认为第一个进入房间的是主持人&#…...

MySQL慢查询日志详解与性能优化指南
1. 什么是慢查询日志 慢查询日志是MySQL提供的一种日志记录功能,它能够记录执行时间超过预设阈值的SQL查询语句,并将这些信息写入到日志文件中。 2. 查看慢查询日志的设置和状态 2.1 慢查询日志的开启状态和日志文件位置 通过以下命令可以查看慢查询…...

xml CDATA
]]>之间的任何内容标记为字符数据。内容不会被解释为标记。 <![CDATA[这里的任何文本,即使是也被解释为文本而不是起始标签]]> 这是什么意思? 这段描述解释了XML中CDATA部分的作用和用法。让我来详细解释一下: CDATA(Character Da…...

C++的线程管理
C的线程管理 线程类(Thread)线程构造器约定构造器初始化构造器复制构造器移动构造器 多线程atomiccondition_variable应用实列 futurepromise应用实列 future应用实列 线程类(Thread) 执行线程是一个指令序列,它可以在…...

捷配笔记-如何设计PCB板布线满足生产标准?
PCB板布线是铺设连接各种设备与通电信号的路径的过程。PCB板布线是铺设连接各种设备与通电信号的路径的过程。 在PCB设计中,布线是完成产品设计的重要步骤。可以说,之前的准备工作已经为它做好了。在整个PCB设计中,布线设计过程具有最高的极限…...

【Java数据结构】初识线性表之一:顺序表
使用Java简单实现一个顺序表 顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构,一般情况下采用数组存储。在数组上完成数据的增删查改。 线性表大致包含如下的一些方法: public class MyArrayList { private int[] array; pri…...