MySQL InnoDB存储引擎
MySQL InnoDB存储引擎
InnoDB 存储引擎的优点:由于 InnoDB 存储引擎存储的数据量大,性能高,可以有效的保证数据安全等优点,在 MySQL 5.5 后称为了默认的存储引擎。
InnoDB 内存结构: 缓冲池(buffer poll) 变更缓冲池(Change Buffer) 日志缓冲区(Log Buffer) 自适应哈希(Adaptive Hash Index)
缓冲池作用:内存中主要工作区域,优化查询性能 变更缓冲区作用:优化修改操作的性能 日志缓冲区作用: 自适应哈希作用:进一步提升查询的性能
磁盘结构中包括: 系统表空间: 独立表空间: 通用表空间: 临时表空间: 撤销表空间: 重做日志: 双写缓冲区:
以上这些都是保存的是真是的数据。
InnoDB 为什么要设计成内存和磁盘两个部分: 因为真实的数据需要保存在磁盘里, 但是磁盘的速度是比较慢的,而严重影响数据库整体的性能,而影响应用程序的性能,所以我们需要将常用的数据放在内存中,提示查询速率,但是内存中的数据是易失的,所以可以将常用的数据缓存在内存里,当第二次查询同样的数据,那么就可以将缓存的数据直接返回给客户端。所以磁盘是用来持久化的,而内存是用来缓存提高效率的。
使用 InnoDB 存储引擎创建的表对应的数据文件在哪里: 1.数据目录所在的路径 当创建一个数据库时,会在数据目录生成一格与数据库同名的子目录,数据库同名的子目录中保存的是表对应的数据文件
MySQL 存储结构: MySQL为了有效的维护数据而定义的一系列数据结构
什么是表空间文件: 表空间文件就是用来存储数据的文件,表空间文件的大小由存储的数据多少决定的,不同的表空间文件存储的种类也是有所不同的,在MySQL 中表空间分为五类,系统表空间,独立表空间,通用表空间,临时表空间,撤销表空间。
表空间和表空间文件的关系: 对于使用者而言,表空间,表空间文件,数据文件,是一个东西。而表空间就是设计层面上的,而表空间文件就是实际层面的,以文件的形式存在在次磁盘上面。
用户数据在表空间中是如何存储的: 想要搞清楚用户的数据在表空间中是如何存储的,实际上我们只需要知道 MySQL 的存储结构是如何定义的,其实这两个就是一个问题。 首先我们知道,用户的数据是以数据行的方式存储在对应的表空间文件中的,所以我们就需要对表空间文件中的数据行进行管理,而为了方便管理,表空间是由,段,区组,区,页,数据行,组成的,其中页是 InnoDB 中磁盘管理的最小单位。
为什么使用页这个数据管理单元: MySQL 是一个应用程序,它是运行在操作系统上的,而 MySQL 不论是数据的存储还是查询,实际上都是需要经过磁盘的,而磁盘作为硬件应用程序并不能直接访问,所以需要通过操作系统,而所以MySQL读取或者是写入都是需要经过操作系统的,但是操作系统一次性读取次磁盘都是最小4k,而MySQL为了一次性读取更多的数据,自己定义了一个数据结构页,一次是16k,而 MySQL 的在读取或者写入的时候大量的时间都是消耗在了磁盘的IO上,但是如果一次性读取16k的话,根据局部性原原理,大概率下一次访问的数据也在这一次读取的数据中,所以下一次就不需要继续访问磁盘了,这样也就提高了MySQL的整体性能。
局部性原理: 程序在执行的时候呈现的局部性规律,整个程序在执行的过程中,在一段时间内大概只执行该程序的的某一部分,而局部性原原理通常有两种形式:时间和空间局部性 时间局部性就是一个信息在被访问的时候,那么大概率在这段时间内会被一直访问。 空间局部性就是正在访问的数据可能就是下一次访问数据的地址空间是相近的。
页结构: MySQL 中有许多不同类型的页,但是每一种页都会包含页头, 页尾, 在页头,页尾之间的页主体信息根据不同的类型有不同的结构,最常见的就是用来存储数据和索引的“索引页”,也叫做 “数据页”,页的注意信息使用数据行进行填充。
查询的数据超过一页的大小,如何提高查询效率: 1.不同的页在磁盘中是不是连续的: 不一定,在不做任何控制的情况下,不同的页在磁盘中申请的地址大概率是不连续的。
2.为什么不连续的地址会降低查询的效率: 当存储的介质是机械硬盘时,访问不连续的地址会带来磁盘寻址的开销,也就是磁盘的随机访问。 因为在磁盘上,当我们需要访问一个数据的时候,需要先找到对应的磁道,然后在找到对应的扇区,最后才是读取数据,所以磁头的移动是很费时的。
3.如果页不是连续的,对访问效率是否有影响:
4.InnoDB 如何保证页在磁盘中的连续性: 为了解决磁盘的随机访问这个问题,所以需要尽可能的在磁道上读取连续的数据,介绍磁头的移动,MySQL 使用区这个结构来管理页,规定每个区固定为1MB, 可以存放64个页,所以即使跨页读取数据,那么大概率也是在附件的地址。
我们知道 InnoDB 是使用区来组织页的,并且每一个区都是固定大小1MB,可以包括64个页,所以说查询的数据超过1页的时候会有下面的情况 页在区内,并且页相邻:这时候磁盘是顺序IO,大幅的提升磁盘的IO效率 页在区内,但不相邻:这时候可以大量的减少磁头的移动,可以提升效率 页在不同的区内:这种情况是不能提升效率的
区的特点:大小1MB
区和页的关系:区是管理页的,区中包含若干个页,保证区中页的连续性
当表中的数据很少的时候,如何避免空间浪费: 为什么表中数据很少的时候会存在空间的浪费?因为区的特点就是一次申请1MB,那么当新创建的表中,数据的大小不能确定,所以不一定这个表一定可以使用完1MB,所以就会存在空间的浪费。 那么MySQL为了解决这个问题,在刚开始创建的表中实际上只有7页,而不是申请一个完整的区。 刚开始的这些页会放在碎片区,当数据量达到32页的时候,后面的申请就会每次申请一个完整的区。 通过零散页和碎片区来避免空间浪费。
如果访问的数据跨区了,如何提高查询效率: 1.区的偏移量 2.区管理的数据的范围 3.用双向链表把区组织起来 对于区组也需要管理自身的属性 1.区组管理数据的范围 2.用双向链表把区组也组织起来 碎片区作为表空间中的第一个区组中的第一个区,而这个区的前四页,这个是比较特殊的: File Space Header:表空间和区组中的条目信息 Insert Buffer Bitmap: Change Buffer 的相关信息 File Segment inode: 段信息 B-tree Node:索引根信息 其他为空闲也用来保存真实的数据 使用区组结构有效的管理区,每个区组管理256个区也就是256MB, 区组条目的信息会记录在每个区的偏移并用双向链表链接。
上面的数据结构还有优化的空间吗: 上面说的区,区组和页都是物理结构,而在这些物理结构的基础上定义了一个逻辑结构,段。 段可以区分不同功能的区在碎片中的页,并按功能分为叶子节点段和非叶子节点段,作为B+树索引中的叶子和非叶子节点。
上面所有的操作是在哪里进行的: 所有的数据库操作在内存中进行的,当数据处理完毕后又会刷新到磁盘中对应的页上。
查询数据时MySQL会一次性将表中的数据全部加载到内存中吗: 如果将一个表中的全部数据都加载到内存中的话,可能这个表的数据量是比较大的,内存是无法满足表中全部的数据的,所以不会吧表中的数据全部加载到内存中。
没查询一条数据都要进行一次IO吗: 前面我们说了当我们查询数据的时候,我们需要先看一下缓存里面有没有,当缓存里面没有的话才会进行磁盘IO,而每一次的磁盘IO也并不是只加载一条数据行,而是当找到对应的数据行的时候,会将该数据行所在的页全部加载到内存中,所以当我们每次进行查询一条数据的时候,并不一定会每次都进行IO,而且在MySQL中如果当一个区中的页经常被访问的时候,MySQL也会将区中的页加载到内存中,以便于访问。
页大小可以设置吗: 在MySQL中有一个系统变量 innodb_page_size 可以设置页大小,这里建议4kb 的整数倍。
在 MySQL 中有哪些页?我们重点关注哪些: 因为 MySQL 中有许多不同的数据需要存储,所以常见的就有,数据页, Undo Log 页, Change Buffer 页, Extent Descriptor 页, 但是我们最关注的是数据页。在InnoDB 中也可以叫索引页。
相关文章:
MySQL InnoDB存储引擎
MySQL InnoDB存储引擎 InnoDB 存储引擎的优点:由于 InnoDB 存储引擎存储的数据量大,性能高,可以有效的保证数据安全等优点,在 MySQL 5.5 后称为了默认的存储引擎。 InnoDB 内存结构: 缓冲池(buffer poll&…...
无头单向非循环链表实现 and leetcode刷题
无头单向非循环链表实现 1. 单链表的模拟实现IList.java接口:MySingleList.java文件: 2. leetcode刷题2.1 获取链表的中间节点2.2 删除链表中所有值为value的元素2.3 单链表的逆置2.4 获取链表倒数第k个节点2.5 给定 x, 把一个链表整理成前半部分小于 x,…...
Ubuntu系统上安装Apache和WordPress
** 第一步跟新系统包 ** 首先跟新系统包 sudo apt update sudo apt upgrade第二步下载安装apache sudo apt install apache2 ##查看apache的状态是否启动成功 sudo systemctl status apache2 ##查看服务器的ip地址 sudo ip a通过ip地址进行访问apache页面 第三步下载安装…...
Doze和AppStandby白名单配置方法和说明
机制 配置路径 配置案例 说明 影响机制 调试命令 Doze /platform/frameworks/base /data/etc/platform.xml allow-in-power-save 【系统应用Doze白名单配置】 Doze\Job\AppStandby\Alarm\WakeLock\Sync 查看Doze白名单:adb shell dumpsys deviceidle 添加Doze白名单…...
坑2.Date类型的请求参数
前端 <el-form-item label"结束日期" prop"endTime"><el-date-pickerv-model"dataForm.endTime"type"date"value-format"yyyy-MM-dd HH:mm:ss"placeholder"选择日期"></el-date-picker></el…...
javaweb ajax maven mybatis spring springmvc 在项目中有什么用, 举例说明
JavaWeb是一种基于Java语言的Web开发技术,可以用来开发动态网站和Web应用程序。 AJAX(Asynchronous JavaScript and XML)是一种在Web开发中用于实现异步通信的技术,可以在不刷新整个网页的情况下更新部分页面内容,提升…...
Python编程学习笔记(4)--- 字典
目录 1 什么是字典 2 使用字典 2.1 访问字典中的值 2.2 添加键值对 2.3 创建空字典 2.4 修改字典中的值 2.5 删除键值对 2.6 类似键值对组成的字典 2.7 使用get()来访问值 3 遍历字典 3.1 遍历所有键值对 3.2 遍历字典中的所有键 3.3 按照特…...
会员运营体系设计及SOP梳理
一些做会员的经验和方法分享给大家,包括顶层思考、流程的梳理、组织的建立,后续会做成系列,最近几期主要围绕顶层策略方面,以下是核心内容的整理: 1、会员运营体系设计 顶层设计与关键业务定位:建立客户运营…...
SQL 自定义函数
概念 自定义函数是用户根据自己的业务逻辑或计算需求创建的函数。这些函数可以接收一个或多个输入参数,执行一系列的操作(如计算、数据处理、逻辑判断等),并最终返回一个值或结果集。自定义函数可以被多次重用,提高了…...
C# 下sendmessage和postmessage的区别详解与示例
文章目录 1、SendMessage2、PostMessage3、两者的区别: 总结 在C#中,SendMessage和PostMessage是两个用于Windows编程的API,它们用于向窗口发送消息。这两个方法都位于System.Windows.Forms命名空间中,通常用于自动化Windows应用程…...
Transformer重要论文与书籍 - Transformer教程
近年来,人工智能领域中的Transformer模型无疑成为了炙手可热的研究对象。从自然语言处理(NLP)到计算机视觉,Transformer展现出了前所未有的强大能力。今天,我们将探讨Tra在当今的人工智能和机器学习领域,Tr…...
android13 rom 开发总纲说明
1. 这里是文章总纲,可以在这里快速找到需要的文章。 2. 文章一般是基于标准的android13,有一些文章可能会涉及到具体平台,例如全志,瑞芯微等一些平台。 3.系统应用 3.1系统应用Launcher3桌面相关: 3.2系统应用设置S…...
2.线性回归
简化的房价模型 假设1:影响房价的关键因素时卧室个数,卫生间和居住面积,记为 x 1 , x 2 , x 3 x_1,x_2,x_3 x1,x2,x3 假设2:成交价时关键因素的加权和: y w 1 x 1 w 2 x 2 w 3 x 3 b y w_1x_1w_2x_2w_3x…...
一文了解java中Optional
文章目录 1. Optional简介2. 常用的接口2.1 常用接口简单使用2.1.1 创建的常用方法2.1.2 获取值的常用方法2.1.3 判定的常用方法2.1.4 判定后的操作方法2.2 map方法介绍 2.2 其他方法2.2.1 Filter 方法2.2.2 FlatMap 方法 3. 常用的实例4. 总结 1. Optional简介 Optional是在ja…...
提示词工程(Prompt Engineering)是什么?
一、定义 Prompt Engineering 提示词工程(Prompt Engineering)是一项通过优化提示词(Prompt)和生成策略,从而获得更好的模型返回结果的工程技术。 二、System message 系统指令 System message可以被广泛应用在&am…...
vue对axios进行请求响应封装
一、原因 像是在一些业务逻辑上,比如需要在请求之前展示loading效果,或者在登录的时候判断身份信息(token)等信息有没有过期,再者根据服务器响应回来的code码进行相应的提示信息。等等在请求之前,之后做的一…...
快速测试electron环境是否安装成功
快速测试electron环境是否安装成功 测试代码正确运行的效果运行错误的效果v22.4.1 版本无法使用v20.15.1版本无法使用v18.20.4 版本无法使用 终极解决办法 测试代码 1.npx create-electron-app my-electron-app 2.cd my-electron-app 3.npm start 正确运行的效果 环境没问题…...
数电设计提问求帮助,出租车计费器。
🏆本文收录于《CSDN问答解惑-》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&…...
xcode项目添加README.md文件并进行编辑
想要给xcode项目添加README.md文件其实还是比较简单的,但是对于不熟悉xcode这个工具的人来讲,还是有些陌生,下面简单给大家讲一下流程。 选择“文件”>“新建”>“文件”,在其他(滚动到工作表底部)下…...
基于 cookiecutter 的 python 项目模板
Cookiecutter 介绍 使用 Python 这种动态语言进行 web 开发,团队中经常会遇到的问题就是代码的质量比较难控制。Python 语言本身灵活性比较高,不加控制的情况下代码质量可能最后很难维护。而且代码的各方面的标准,比如提示的 lint࿰…...
云原生核心技术 (7/12): K8s 核心概念白话解读(上):Pod 和 Deployment 究竟是什么?
大家好,欢迎来到《云原生核心技术》系列的第七篇! 在上一篇,我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在,我们就像一个拥有了一块崭新数字土地的农场主,是时…...
Golang 面试经典题:map 的 key 可以是什么类型?哪些不可以?
Golang 面试经典题:map 的 key 可以是什么类型?哪些不可以? 在 Golang 的面试中,map 类型的使用是一个常见的考点,其中对 key 类型的合法性 是一道常被提及的基础却很容易被忽视的问题。本文将带你深入理解 Golang 中…...
基于uniapp+WebSocket实现聊天对话、消息监听、消息推送、聊天室等功能,多端兼容
基于 UniApp + WebSocket实现多端兼容的实时通讯系统,涵盖WebSocket连接建立、消息收发机制、多端兼容性配置、消息实时监听等功能,适配微信小程序、H5、Android、iOS等终端 目录 技术选型分析WebSocket协议优势UniApp跨平台特性WebSocket 基础实现连接管理消息收发连接…...
JVM垃圾回收机制全解析
Java虚拟机(JVM)中的垃圾收集器(Garbage Collector,简称GC)是用于自动管理内存的机制。它负责识别和清除不再被程序使用的对象,从而释放内存空间,避免内存泄漏和内存溢出等问题。垃圾收集器在Ja…...
MySQL中【正则表达式】用法
MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现(两者等价),用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例: 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...
网络编程(UDP编程)
思维导图 UDP基础编程(单播) 1.流程图 服务器:短信的接收方 创建套接字 (socket)-----------------------------------------》有手机指定网络信息-----------------------------------------------》有号码绑定套接字 (bind)--------------…...
听写流程自动化实践,轻量级教育辅助
随着智能教育工具的发展,越来越多的传统学习方式正在被数字化、自动化所优化。听写作为语文、英语等学科中重要的基础训练形式,也迎来了更高效的解决方案。 这是一款轻量但功能强大的听写辅助工具。它是基于本地词库与可选在线语音引擎构建,…...
Linux系统部署KES
1、安装准备 1.版本说明V008R006C009B0014 V008:是version产品的大版本。 R006:是release产品特性版本。 C009:是通用版 B0014:是build开发过程中的构建版本2.硬件要求 #安全版和企业版 内存:1GB 以上 硬盘…...
【堆垛策略】设计方法
堆垛策略的设计是积木堆叠系统的核心,直接影响堆叠的稳定性、效率和容错能力。以下是分层次的堆垛策略设计方法,涵盖基础规则、优化算法和容错机制: 1. 基础堆垛规则 (1) 物理稳定性优先 重心原则: 大尺寸/重量积木在下…...
WEB3全栈开发——面试专业技能点P4数据库
一、mysql2 原生驱动及其连接机制 概念介绍 mysql2 是 Node.js 环境中广泛使用的 MySQL 客户端库,基于 mysql 库改进而来,具有更好的性能、Promise 支持、流式查询、二进制数据处理能力等。 主要特点: 支持 Promise / async-await…...
