MySQL InnoDB存储引擎
MySQL InnoDB存储引擎
InnoDB 存储引擎的优点:由于 InnoDB 存储引擎存储的数据量大,性能高,可以有效的保证数据安全等优点,在 MySQL 5.5 后称为了默认的存储引擎。
InnoDB 内存结构: 缓冲池(buffer poll) 变更缓冲池(Change Buffer) 日志缓冲区(Log Buffer) 自适应哈希(Adaptive Hash Index)
缓冲池作用:内存中主要工作区域,优化查询性能 变更缓冲区作用:优化修改操作的性能 日志缓冲区作用: 自适应哈希作用:进一步提升查询的性能
磁盘结构中包括: 系统表空间: 独立表空间: 通用表空间: 临时表空间: 撤销表空间: 重做日志: 双写缓冲区:
以上这些都是保存的是真是的数据。
InnoDB 为什么要设计成内存和磁盘两个部分: 因为真实的数据需要保存在磁盘里, 但是磁盘的速度是比较慢的,而严重影响数据库整体的性能,而影响应用程序的性能,所以我们需要将常用的数据放在内存中,提示查询速率,但是内存中的数据是易失的,所以可以将常用的数据缓存在内存里,当第二次查询同样的数据,那么就可以将缓存的数据直接返回给客户端。所以磁盘是用来持久化的,而内存是用来缓存提高效率的。
使用 InnoDB 存储引擎创建的表对应的数据文件在哪里: 1.数据目录所在的路径 当创建一个数据库时,会在数据目录生成一格与数据库同名的子目录,数据库同名的子目录中保存的是表对应的数据文件
MySQL 存储结构: MySQL为了有效的维护数据而定义的一系列数据结构
什么是表空间文件: 表空间文件就是用来存储数据的文件,表空间文件的大小由存储的数据多少决定的,不同的表空间文件存储的种类也是有所不同的,在MySQL 中表空间分为五类,系统表空间,独立表空间,通用表空间,临时表空间,撤销表空间。
表空间和表空间文件的关系: 对于使用者而言,表空间,表空间文件,数据文件,是一个东西。而表空间就是设计层面上的,而表空间文件就是实际层面的,以文件的形式存在在次磁盘上面。
用户数据在表空间中是如何存储的: 想要搞清楚用户的数据在表空间中是如何存储的,实际上我们只需要知道 MySQL 的存储结构是如何定义的,其实这两个就是一个问题。 首先我们知道,用户的数据是以数据行的方式存储在对应的表空间文件中的,所以我们就需要对表空间文件中的数据行进行管理,而为了方便管理,表空间是由,段,区组,区,页,数据行,组成的,其中页是 InnoDB 中磁盘管理的最小单位。
为什么使用页这个数据管理单元: MySQL 是一个应用程序,它是运行在操作系统上的,而 MySQL 不论是数据的存储还是查询,实际上都是需要经过磁盘的,而磁盘作为硬件应用程序并不能直接访问,所以需要通过操作系统,而所以MySQL读取或者是写入都是需要经过操作系统的,但是操作系统一次性读取次磁盘都是最小4k,而MySQL为了一次性读取更多的数据,自己定义了一个数据结构页,一次是16k,而 MySQL 的在读取或者写入的时候大量的时间都是消耗在了磁盘的IO上,但是如果一次性读取16k的话,根据局部性原原理,大概率下一次访问的数据也在这一次读取的数据中,所以下一次就不需要继续访问磁盘了,这样也就提高了MySQL的整体性能。
局部性原理: 程序在执行的时候呈现的局部性规律,整个程序在执行的过程中,在一段时间内大概只执行该程序的的某一部分,而局部性原原理通常有两种形式:时间和空间局部性 时间局部性就是一个信息在被访问的时候,那么大概率在这段时间内会被一直访问。 空间局部性就是正在访问的数据可能就是下一次访问数据的地址空间是相近的。
页结构: MySQL 中有许多不同类型的页,但是每一种页都会包含页头, 页尾, 在页头,页尾之间的页主体信息根据不同的类型有不同的结构,最常见的就是用来存储数据和索引的“索引页”,也叫做 “数据页”,页的注意信息使用数据行进行填充。
查询的数据超过一页的大小,如何提高查询效率: 1.不同的页在磁盘中是不是连续的: 不一定,在不做任何控制的情况下,不同的页在磁盘中申请的地址大概率是不连续的。
2.为什么不连续的地址会降低查询的效率: 当存储的介质是机械硬盘时,访问不连续的地址会带来磁盘寻址的开销,也就是磁盘的随机访问。 因为在磁盘上,当我们需要访问一个数据的时候,需要先找到对应的磁道,然后在找到对应的扇区,最后才是读取数据,所以磁头的移动是很费时的。
3.如果页不是连续的,对访问效率是否有影响:
4.InnoDB 如何保证页在磁盘中的连续性: 为了解决磁盘的随机访问这个问题,所以需要尽可能的在磁道上读取连续的数据,介绍磁头的移动,MySQL 使用区这个结构来管理页,规定每个区固定为1MB, 可以存放64个页,所以即使跨页读取数据,那么大概率也是在附件的地址。
我们知道 InnoDB 是使用区来组织页的,并且每一个区都是固定大小1MB,可以包括64个页,所以说查询的数据超过1页的时候会有下面的情况 页在区内,并且页相邻:这时候磁盘是顺序IO,大幅的提升磁盘的IO效率 页在区内,但不相邻:这时候可以大量的减少磁头的移动,可以提升效率 页在不同的区内:这种情况是不能提升效率的
区的特点:大小1MB
区和页的关系:区是管理页的,区中包含若干个页,保证区中页的连续性
当表中的数据很少的时候,如何避免空间浪费: 为什么表中数据很少的时候会存在空间的浪费?因为区的特点就是一次申请1MB,那么当新创建的表中,数据的大小不能确定,所以不一定这个表一定可以使用完1MB,所以就会存在空间的浪费。 那么MySQL为了解决这个问题,在刚开始创建的表中实际上只有7页,而不是申请一个完整的区。 刚开始的这些页会放在碎片区,当数据量达到32页的时候,后面的申请就会每次申请一个完整的区。 通过零散页和碎片区来避免空间浪费。
如果访问的数据跨区了,如何提高查询效率: 1.区的偏移量 2.区管理的数据的范围 3.用双向链表把区组织起来 对于区组也需要管理自身的属性 1.区组管理数据的范围 2.用双向链表把区组也组织起来 碎片区作为表空间中的第一个区组中的第一个区,而这个区的前四页,这个是比较特殊的: File Space Header:表空间和区组中的条目信息 Insert Buffer Bitmap: Change Buffer 的相关信息 File Segment inode: 段信息 B-tree Node:索引根信息 其他为空闲也用来保存真实的数据 使用区组结构有效的管理区,每个区组管理256个区也就是256MB, 区组条目的信息会记录在每个区的偏移并用双向链表链接。
上面的数据结构还有优化的空间吗: 上面说的区,区组和页都是物理结构,而在这些物理结构的基础上定义了一个逻辑结构,段。 段可以区分不同功能的区在碎片中的页,并按功能分为叶子节点段和非叶子节点段,作为B+树索引中的叶子和非叶子节点。
上面所有的操作是在哪里进行的: 所有的数据库操作在内存中进行的,当数据处理完毕后又会刷新到磁盘中对应的页上。
查询数据时MySQL会一次性将表中的数据全部加载到内存中吗: 如果将一个表中的全部数据都加载到内存中的话,可能这个表的数据量是比较大的,内存是无法满足表中全部的数据的,所以不会吧表中的数据全部加载到内存中。
没查询一条数据都要进行一次IO吗: 前面我们说了当我们查询数据的时候,我们需要先看一下缓存里面有没有,当缓存里面没有的话才会进行磁盘IO,而每一次的磁盘IO也并不是只加载一条数据行,而是当找到对应的数据行的时候,会将该数据行所在的页全部加载到内存中,所以当我们每次进行查询一条数据的时候,并不一定会每次都进行IO,而且在MySQL中如果当一个区中的页经常被访问的时候,MySQL也会将区中的页加载到内存中,以便于访问。
页大小可以设置吗: 在MySQL中有一个系统变量 innodb_page_size 可以设置页大小,这里建议4kb 的整数倍。
在 MySQL 中有哪些页?我们重点关注哪些: 因为 MySQL 中有许多不同的数据需要存储,所以常见的就有,数据页, Undo Log 页, Change Buffer 页, Extent Descriptor 页, 但是我们最关注的是数据页。在InnoDB 中也可以叫索引页。
相关文章:
MySQL InnoDB存储引擎
MySQL InnoDB存储引擎 InnoDB 存储引擎的优点:由于 InnoDB 存储引擎存储的数据量大,性能高,可以有效的保证数据安全等优点,在 MySQL 5.5 后称为了默认的存储引擎。 InnoDB 内存结构: 缓冲池(buffer poll&…...
无头单向非循环链表实现 and leetcode刷题
无头单向非循环链表实现 1. 单链表的模拟实现IList.java接口:MySingleList.java文件: 2. leetcode刷题2.1 获取链表的中间节点2.2 删除链表中所有值为value的元素2.3 单链表的逆置2.4 获取链表倒数第k个节点2.5 给定 x, 把一个链表整理成前半部分小于 x,…...
Ubuntu系统上安装Apache和WordPress
** 第一步跟新系统包 ** 首先跟新系统包 sudo apt update sudo apt upgrade第二步下载安装apache sudo apt install apache2 ##查看apache的状态是否启动成功 sudo systemctl status apache2 ##查看服务器的ip地址 sudo ip a通过ip地址进行访问apache页面 第三步下载安装…...
Doze和AppStandby白名单配置方法和说明
机制 配置路径 配置案例 说明 影响机制 调试命令 Doze /platform/frameworks/base /data/etc/platform.xml allow-in-power-save 【系统应用Doze白名单配置】 Doze\Job\AppStandby\Alarm\WakeLock\Sync 查看Doze白名单:adb shell dumpsys deviceidle 添加Doze白名单…...
坑2.Date类型的请求参数
前端 <el-form-item label"结束日期" prop"endTime"><el-date-pickerv-model"dataForm.endTime"type"date"value-format"yyyy-MM-dd HH:mm:ss"placeholder"选择日期"></el-date-picker></el…...
javaweb ajax maven mybatis spring springmvc 在项目中有什么用, 举例说明
JavaWeb是一种基于Java语言的Web开发技术,可以用来开发动态网站和Web应用程序。 AJAX(Asynchronous JavaScript and XML)是一种在Web开发中用于实现异步通信的技术,可以在不刷新整个网页的情况下更新部分页面内容,提升…...
Python编程学习笔记(4)--- 字典
目录 1 什么是字典 2 使用字典 2.1 访问字典中的值 2.2 添加键值对 2.3 创建空字典 2.4 修改字典中的值 2.5 删除键值对 2.6 类似键值对组成的字典 2.7 使用get()来访问值 3 遍历字典 3.1 遍历所有键值对 3.2 遍历字典中的所有键 3.3 按照特…...
会员运营体系设计及SOP梳理
一些做会员的经验和方法分享给大家,包括顶层思考、流程的梳理、组织的建立,后续会做成系列,最近几期主要围绕顶层策略方面,以下是核心内容的整理: 1、会员运营体系设计 顶层设计与关键业务定位:建立客户运营…...
SQL 自定义函数
概念 自定义函数是用户根据自己的业务逻辑或计算需求创建的函数。这些函数可以接收一个或多个输入参数,执行一系列的操作(如计算、数据处理、逻辑判断等),并最终返回一个值或结果集。自定义函数可以被多次重用,提高了…...
C# 下sendmessage和postmessage的区别详解与示例
文章目录 1、SendMessage2、PostMessage3、两者的区别: 总结 在C#中,SendMessage和PostMessage是两个用于Windows编程的API,它们用于向窗口发送消息。这两个方法都位于System.Windows.Forms命名空间中,通常用于自动化Windows应用程…...
Transformer重要论文与书籍 - Transformer教程
近年来,人工智能领域中的Transformer模型无疑成为了炙手可热的研究对象。从自然语言处理(NLP)到计算机视觉,Transformer展现出了前所未有的强大能力。今天,我们将探讨Tra在当今的人工智能和机器学习领域,Tr…...
android13 rom 开发总纲说明
1. 这里是文章总纲,可以在这里快速找到需要的文章。 2. 文章一般是基于标准的android13,有一些文章可能会涉及到具体平台,例如全志,瑞芯微等一些平台。 3.系统应用 3.1系统应用Launcher3桌面相关: 3.2系统应用设置S…...
2.线性回归
简化的房价模型 假设1:影响房价的关键因素时卧室个数,卫生间和居住面积,记为 x 1 , x 2 , x 3 x_1,x_2,x_3 x1,x2,x3 假设2:成交价时关键因素的加权和: y w 1 x 1 w 2 x 2 w 3 x 3 b y w_1x_1w_2x_2w_3x…...
一文了解java中Optional
文章目录 1. Optional简介2. 常用的接口2.1 常用接口简单使用2.1.1 创建的常用方法2.1.2 获取值的常用方法2.1.3 判定的常用方法2.1.4 判定后的操作方法2.2 map方法介绍 2.2 其他方法2.2.1 Filter 方法2.2.2 FlatMap 方法 3. 常用的实例4. 总结 1. Optional简介 Optional是在ja…...
提示词工程(Prompt Engineering)是什么?
一、定义 Prompt Engineering 提示词工程(Prompt Engineering)是一项通过优化提示词(Prompt)和生成策略,从而获得更好的模型返回结果的工程技术。 二、System message 系统指令 System message可以被广泛应用在&am…...
vue对axios进行请求响应封装
一、原因 像是在一些业务逻辑上,比如需要在请求之前展示loading效果,或者在登录的时候判断身份信息(token)等信息有没有过期,再者根据服务器响应回来的code码进行相应的提示信息。等等在请求之前,之后做的一…...
快速测试electron环境是否安装成功
快速测试electron环境是否安装成功 测试代码正确运行的效果运行错误的效果v22.4.1 版本无法使用v20.15.1版本无法使用v18.20.4 版本无法使用 终极解决办法 测试代码 1.npx create-electron-app my-electron-app 2.cd my-electron-app 3.npm start 正确运行的效果 环境没问题…...
数电设计提问求帮助,出租车计费器。
🏆本文收录于《CSDN问答解惑-》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收藏&…...
xcode项目添加README.md文件并进行编辑
想要给xcode项目添加README.md文件其实还是比较简单的,但是对于不熟悉xcode这个工具的人来讲,还是有些陌生,下面简单给大家讲一下流程。 选择“文件”>“新建”>“文件”,在其他(滚动到工作表底部)下…...
基于 cookiecutter 的 python 项目模板
Cookiecutter 介绍 使用 Python 这种动态语言进行 web 开发,团队中经常会遇到的问题就是代码的质量比较难控制。Python 语言本身灵活性比较高,不加控制的情况下代码质量可能最后很难维护。而且代码的各方面的标准,比如提示的 lint࿰…...
中山网站建设哪家好?从AI搜索变革看网站建设的规范流程
在讨论“中山网站建设哪家好”之前,有一个更底层的问题需要先理解:👉 网站的价值,正在被AI重新定义。一、信息获取路径正在发生根本变化过去二十年,用户获取信息的方式大致是:用户提出问题 → 打开搜索引擎…...
25岁后为什么老得快?你的细胞在偷偷减少
有没有发现一个扎心的事实:25岁像是一道隐形的分水岭,把青春和初老狠狠隔开。20岁的时候,通宵打游戏、追剧、赶ddl,第二天睡半天就能满血复活,脸上看不到一丝疲惫,皮肤透着原生态的光泽,哪怕偶尔…...
OpenClaw性能调优:降低Phi-3-mini-128k-instruct长任务token消耗的技巧
OpenClaw性能调优:降低Phi-3-mini-128k-instruct长任务token消耗的技巧 1. 问题背景:长任务带来的token消耗困境 上周我在用OpenClaw处理一个文档整理任务时,遇到了一个棘手的问题。这个任务需要读取50多份Markdown格式的技术文档ÿ…...
OpenClaw替代方案:Qwen2.5-VL-7B与其他自动化工具对比
OpenClaw替代方案:Qwen2.5-VL-7B与其他自动化工具对比 1. 自动化工具选型的核心考量 当我们需要选择一款自动化工具时,通常会面临几个关键问题:这个工具能否理解我的需求?它能在我的设备上安全运行吗?它是否足够灵活…...
实战应用开发:基于快马平台构建集成heic转换功能的图片管理系统
最近在做一个图片管理系统的项目,其中遇到一个很实际的需求:用户上传的HEIC格式照片需要自动转换成通用的JPG格式。这个功能看似简单,但实际开发中需要考虑很多细节。下面分享下我在InsCode(快马)平台上实现这个功能的完整过程。 项目整体架构…...
新手福音:用快马平台理解openclaw架构图并生成你的第一个应用
新手福音:用快马平台理解openclaw架构图并生成你的第一个应用 作为一个刚入门的开发者,第一次看到openclaw架构图时,那些方框和箭头让我一头雾水。直到在InsCode(快马)平台上动手实践后,才发现原来架构图可以这么直观。下面分享我…...
SEO_10个提升网站排名的SEO技巧与实战方法
SEO:10个提升网站排名的SEO技巧与实战方法 在当今数字化时代,网站排名不仅关乎网站的曝光率,更影响到业务的发展。因此,提升网站排名(SEO)成为了每一个网站主的首要任务。有哪些SEO技巧能够帮助提升网站的排名呢&…...
被头条、站长论坛力荐!爱娃子博客:五年深耕,藏着普通人最动人的生活真相
在流量至上、内容同质化严重的当下,想找到一个不迎合热度、不堆砌噱头,却能让人反复品读、获得共鸣的博客,早已成为很多人的奢望。而今天要给大家推荐的爱娃子博客,正是这样一处被各大平台力荐的“心灵栖息地”——它不仅被今日头…...
基于深度学习的文本情感分析改进模型实验方案
基于深度学习的文本情感分析改进模型实验方案 一、实验背景与目的 1.1 背景 情感分析是自然语言处理的核心任务之一,旨在自动识别文本所表达的情感倾向(如正面、负面)。传统机器学习方法依赖人工特征工程,而深度学习方法能够自动学习文本的层次化特征表示。然而,现有模…...
何为多态?
多态的概念多态是面向对象编程的三大特性之一(封装、继承、多态),指同一操作作用于不同对象时会产生不同的行为。具体表现为父类引用指向子类对象,并在运行时根据实际对象类型调用相应的方法。多态的好处提高代码扩展性通过多态&a…...
