当前位置: 首页 > news >正文

MySQL之深入InnoDB存储引擎——物理文件

文章目录

    • 一、参数文件
    • 二、日志文件
    • 三、表结构定义文件
    • 四、InnoDB 存储引擎文件
      • 1、表空间文件
      • 2、重做日志文件

一、参数文件

当 MySQL 实例启动时,数据库会先去读一个配置参数文件,用来寻找数据库的各种文件所在位置以及指定某些初始化参数。在默认情况下,MySQL 实例会按照一定的顺序在指定的位置读取,没有参数文件也可以运行,这时所有的参数值取决于编译 MySQL 时指定的默认值和源代码中指定参数的默认值。

但是如果在默认的数据库目录下找不到 mysql 架构,则启动同样失败,mysql 架构中记录了访问该实例的权限。

可以通过命令**show variables**来查看数据库中的所有参数(可以通过 like 来过滤参数名)。

MySQL 数据库中的参数可以分为两类:

  • 动态参数:可以在 MySQL 实例运行中进行更改
  • 静态参数:在整个实例生命周期内只读,不可进行修改

可以通过 set 命令对动态参数进行修改,通过@@global和@@session来指定是对当前会话进行修改还是对整个实例生命周期都生效。

二、日志文件

  • 错误日志

  • 慢查询日志:可以在 MySQL 启动时设置一个阈值,将运行时间超过该值的所有 SQL 语句都记录到慢查询日志文件中,该阈值可以通过参数 long_query_time 来设置,默认为 10 秒。默认情况下不开启慢查询日志,可以通过 log_slow_queries 参数来开启

    • log_queries_not_using_indexes 参数用来开启记录没有使用索引的 SQL 语句
    • log_throttle_queries_not_using_indexes 参数用来表示每分钟允许记录到 slow log 的且未使用索引的 SQL 语句次数,默认为 0,即没有限制
    • 可以通过 mysqldumpslow 命令来方便的查看相关的信息
    • 可以通过 log_output 指定慢查询输出的格式,默认为 FILE,可以将它设置为 TABLE,之后就可以查询 mysql 架构下的 slow_log 表
  • 查询日志:记录了所有对 MySQL 数据库请求的信息,无论请求是否得到了正确的执行(甚至包括 Access denied的请求)

  • 二进制日志:记录了对 MySQL 数据库执行更改的所有操作,不包括 SELECT 和 SHOW 这类操作(需要使用查询日志)

二进制日志文件主要右以下几种作用:

  • 恢复:某些数据的恢复需要二进制日志

    • 例如在一个数据库全备文件恢复后,用户可以通过二进制日志进行 point-in-time 的恢复
  • 复制:原理与恢复相似,通过复制和执行二进制日志使 slave 数据库与 master 数据库进行实时同步

  • 审计:用户可以通过二进制日志中的信息来进行审计,判断是否有对数据库进行注入的攻击

**二进制文件在默认情况下并没有启动,**需要手动指定参数来启动。开启这个选项会对数据库的整体性能有所影响,但是影响十分有限(1%)。如果使用 InnoDB 存储引擎进行复制,并且想得到最大的高可用性,建议开启。

在默认情况下,二进制日志并不是每次写的时候就同步磁盘,因此当数据库所在操作系统发生宕机时,可能会有最后一部分数据没有写入二进制日志文件。

  • sync_binlog=1:每次提交事务的时候直接使用 fsync 写入磁盘,不使用操作系统的缓冲、
  • sync_binlog=0(默认值):每次提交事务的时候都保存到操作系统的 page cache,之后由文件系统自己控制缓存的刷新
  • sync_binlog>1:每次提交事务都先写到 page cache,等到积累了 N 个事务之后才 MySQL 调用操作系统刷新操作刷入盘

在这里插入图片描述

日志的记录格式有以下三种:

  1. STATEMENT:记录的是逻辑 SQL 语句

  2. ROW:记录的不再是简单的 SQL 语句,而是记录行更改情况,如果一个update语句修改一百行数据,那么这种模式下就会记录100行对应的记录日志

  3. MIXED:默认使用 STATEMENT 格式保存,一些情况下(无法完成主从复制的操作)使用 ROW 格式保存

    1. 使用了 UUID()、USER()、CURRENT_USER()、FOUND_ROWS()、ROW_COUNTS() 等不确定函数
    2. 使用了 INSERT DELAY 语句
    3. 使用了用户定义函数
    4. 使用了临时表

一个 SQL 在不同的时间点执行它们产生的数据变化和影响是不一样的,所以这种情况下,数据同步或恢复的时候就容易出现不一致的情况,因此使用 ROW 可以带来更好的可靠性

binlog 是二进制文件,需要使用 mysqlbinlog 命令查看。

三、表结构定义文件

因为 MySQL 插件式存储引擎的体系结构的关系,MySQL 数据的存储是根据表的, 每个表都会有与之对应的文件。在 MySQL 8 之前不论表采用何种存储引擎,都有一个以 frm 为后缀名的文件,记录了该表的表结构定义。MySQL 8之后 InnoDB 存储引擎的表定义结构整合到 ibd 文件中,而 MyISAM 的 frm 文件变为 sdi 文件。

四、InnoDB 存储引擎文件

前面的文件都是 MySQL 数据库本身的文件,和存储引擎无关。除了这些文件外,每个表存储引擎还有自己独有的文件。

1、表空间文件

InnoDB 存储引擎可将所有数据存放于 ibdata* 的共享表空间,也可将每张表存放于独立的 .ibd 文件的独立表空间(部分数据)。共享表空间以及独立表空间都是针对数据的存储方式而言的。

  • 共享表空间:某一个数据库的所有的表数据,索引文件全部放在一个文件中,默认这个共享表空间的文件路径在 data 目录下。 默认的文件名为 ibdata1,初始大小为 10M。可以使用 innodb_data_file_path 设置一个或者多个文件组成表空间,同时可以指定大小属性,如果用完文件可以自动增长

    • 其中会包括 undo 信息,在事务未提交时数据即已经写入了表空间文件,当事务rollback时Undo信息不会被删除,但是此空间会被标记,后续会以覆盖的方式被重新使用
    • Changebuffer 和 doublewrite buffer 也保存在其中
  • 独立表空间:可以通过 innodb_file_per_table = ON 来开启独立表空间。开启后每个表都会生成独立的 .ibd 文件来进行存储

    • 包括了单独一个表的数据、索引等内容
    • 其余数据仍存放在共享表空间中,默认情况下独立表空间的存储位置也是在表的位置之中。

InnoDB 采用将存储的数据按表空间进行存放的设计。在默认配置下会有一个初始大小为 10 MB,名为 ibdata1 的文件,该文件就是默认的共享表空间文件。

2、重做日志文件

在默认情况下,data 目录下会有两个名为 ib_logfile0 和 ib_logfile1的文件。每个 InnoDB 存储引擎至少有一个重做日志文件组,每个文件组下至少有 2 个重做日志文件。为了得到更高的可靠性,可以设置多个镜像日志组,将不同的文件组放在不同的磁盘以此提高重做日志的可用性。

在日志组中每个重做日志文件的大小一致,并以循环写入的方式运行。InnoDB 存储引擎险些重做日志文件1,当到达文件的最后时,会切换至重做日志文件2,再当重做日志2也被写满时,会再切换到重做日志文件1中。

在这里插入图片描述

重做日志文件不能设置的太大,否则恢复时可能需要很长的时间,也不能设置的太小,否则可能导致一个事务的日志需要多次切换重做日志文件,并且导致频繁地发生 async checkpoint,导致性能的抖动。

与 binlog 的区别:

  1. binlog 会记录所有与 MySQL 数据库有关的日志记录,包括 InnoDB、MyISAM、Heap 等,而 redo log 只记录 InooDB 存储引擎本身的事务日志
  2. binlog 记录的是关于一个事务的具体操作内容,即该日志是逻辑日志,而 redo log 记录的是关于每个页的更改的物理情况
  3. binlog 仅在事务提交前进行提交,即一个事务只刷盘一次,而重做日志条目会在事务进行的过程中不断地写入到重做日志文件中
  4. binlog 是可以追加写入的(指 binlog 文件写到一定大小后会切换到下一个,并不会覆盖以前的日志,保存的是全量的日志),redo log 是循环写的,空间固定会用完,只会记录未刷盘的日志,已经刷入磁盘的数据都会因为空间有限而在后续被覆盖

虽然 binlog 拥有全量的日志,但没有一个标志让 innoDB 判断哪些数据已经刷盘,哪些数据还没有。而 redo log 每次刷盘会更新日志文件中的Check Point根据对应的LSN来判断该条操作是否已经落盘。所以redo log具有crash-safe能力

redo log 条目结构:

  • redo_log_type:一个字节,表示重做日志的类型
  • space:表空间的ID,采用压缩的方式,有可能小于 4 个字节
  • page_no:页的偏移量,同样采用压缩的方式
  • redo_log_body:重做日志的数据部分

重做日志缓冲往磁盘写入时,是按 512 个字节,也就是一个扇区的大小进行写入。因为扇区时写入的最小单位,因此可以保证写入必定是成功的,所以重做日志的写入过程中不需要有 doublewrite。

重做日志的写入磁盘的情况:

  1. 每秒 Master Thread 都会将重做日志缓冲写入磁盘的重做日志文件中,不论事务是否已经提交

  2. 事务提交时,根据 innodb_flush_log_at_trx_commit 参数控制:

    • 0 表示提交事务时不将事务的重做日志写入磁盘的日志文件,而是等待主线程每秒的刷新

    • 1 表示提交时将重做日志缓冲同步写到磁盘,即伴随 fsync

    • 2 表示提交时将重做日志缓冲异步写道磁盘,即写道文件系统的缓存中,因此不能完全保证在执行 commit 时肯定会写入重做日志文件

      • 设置为 2 时当数据库宕机而操作做系统以及服务器没有发生故障时数据不会丢失

相关文章:

MySQL之深入InnoDB存储引擎——物理文件

文章目录 一、参数文件二、日志文件三、表结构定义文件四、InnoDB 存储引擎文件1、表空间文件2、重做日志文件 一、参数文件 当 MySQL 实例启动时,数据库会先去读一个配置参数文件,用来寻找数据库的各种文件所在位置以及指定某些初始化参数。在默认情况…...

Jquery操作html常用函数

1. text() 获取元素的文本内容:$("#element").text(); 设置元素的文本内容:$("#element").text("New Text"); 2. html() 获取元素的 HTML 内容:$("#element").html(); 设置元素的 HTML 内容&am…...

【Lua学习笔记】Lua进阶——Table,迭代器

文章目录 官方唯一指定数据结构--tabletable的一万种用法字典和数组 迭代器ipairs()pairs() 回到Table 在【Lua学习笔记】Lua入门中我们讲到了Lua的一些入门知识点,本文将补充Lua的一些进阶知识 官方唯一指定数据结构–table 在上篇文章的最后,我们指出…...

重庆市北斗新型智慧城市政府项目

技术栈:使用vue2JavaScriptElementUIvuexaxiosmapboxcesium 项目描述:重庆市北斗新型智慧城市政府项目是基于千寻孪界开发的一款智慧城市项目,包含车辆实时位置定位,智能设备的报警,基础设施的部设等等功能 工作内容&a…...

FANUC机器人SRVO-217故障报警原因分析及参考解决办法

FANUC机器人SRVO-217故障报警原因分析及参考解决办法 如下图所示,示教器提示:SRVO-217紧急停止电路板未找到, 查阅手册可以看到以下的报警说明: 故障原因: 通电时未能识别紧急停止电路板或者增设的安全I/O装置。连接有多个安全I/O装置的系统中,在报警信息的最后,会显示发…...

统信UOS安装mysql数据库(mariadb)-统信UOS安装JDK-统信UOS安装nginx(附安装包)

统信UOS离线全套安装教程(手把手教程) 银河麒麟的各种离线全套安装教程: https://blog.csdn.net/ACCPluzhiqi/article/details/131988147 1.统信UOS桌面系统安装mysql(mariadb) 2.统信UOS桌面系统安装JDK 3.统信UOS桌…...

上门小程序开发|上门服务小程序|上门家政小程序开发

随着移动互联网的普及和发展,上门服务成为了许多人生活中的一部分。上门小程序是一种基于小程序平台的应用程序,它提供了上门服务的在线平台,为用户提供了便捷的上门服务体验。下面将介绍一些适合开发上门小程序的商家。   家政服务商家&am…...

1000道网络安全必备面试题合集,秋招金九银十必看!!!

以下为网络安全各个方向涉及的面试题,星数越多代表问题出现的几率越大,祝各位都能找到满意的工作。 注:本套面试题,已整理成pdf文档,但内容还在持续更新中,因为无论如何都不可能覆盖所有的面试问题&#x…...

从0-1实现简易Raft分布式共识算法

一、Raft前置简介 Raft目前是最著名的分布式共识性算法,被广泛的应用在各种分布式框架、组件中,如Redis、RocketMq、Kafka、Nacos(CP)等 根据Raft论文,可将Raft拆分为如下4个功能模块: 领导者选举日志同…...

Spring 创建和使用

Spring 是⼀个包含了众多⼯具⽅法的 IoC 容器。既然是容器那么它就具备两个最基本的功能: 将对象存储到容器(Spring)中; 从容器中将对象取出来。 在 Java 语⾔中对象也叫做 Bean 1.创建 Spring 项目 接下来使⽤ Maven ⽅式来创…...

Javadoc comment自动生成

光标放在第二行 按下Alt Shift j 下面是Java doc的生成 Next Next-> Finish...

vue3 +ts 报错 index.vue 不是模块

那是因为index.vue中创建了一个空的script标签,而且语法使用的是ts语法。vue-cli会用ts语法解析和校验 如果是无状态组件,删掉 如果是有状态组件,导出该组件的实例 去掉null的script后:...

win10 hadoop报错 unable to load native-hadoop library

win10 安装hadoop执行hdfs -namenode format 和运行hadoop的start-all报错 unable to load native-hadoop library 验证: hadoop checknative -a 这个命令返回都是false是错的 返回下图是正确的 winutils: true D:\soft\hadoop-3.0.0\bin\winutils.exe Native li…...

前端(九)——探索微信小程序、Vue、React和Uniapp生命周期

🙂博主:小猫娃来啦 🙂文章核心:探索微信小程序、Vue、React和Uniapp生命周期 文章目录 微信小程序、Vue、React和Uniapp的基本定义和应用领域微信小程序生命周期生命周期概述页面生命周期应用生命周期组件和API的生命周期钩子 Vu…...

MyBatis查询数据库(2)

目录 前言🍭 一、增删查改操作 1、查 Ⅰ、mapper接口: Ⅱ、UserMapper.xml 查询所有用户的具体实现 SQL: Ⅲ、进行单元测试 2、增、删、改操作 Ⅰ、增 添加用户 添加用户并且返回自增 id Ⅱ、改 根据id修改用户名 开启 MyBatis …...

Jenkins构建完成后发送消息至钉钉

钉钉群的最终效果: 1、jenkins安装DingTalk插件,安装完成后重启 2、配置钉钉插件 参考官网文档:快速开始 | 钉钉机器人插件 系统管理 拉到最下面,可以看到钉钉配置 按照如下配置钉钉机器人 配置完成可以点击测试按钮&#xff0…...

从浏览器输入url到页面加载(六)前端必须了解的路由器和光纤小知识

前言 上一章我们说到了数据包在网线中的故事,说到了双绞线,还说到了麻花。这一章继续沿着这条线路往下走,说一些和cdn以及路由器相关,运营商以及光纤相关的小知识,前端同学应该了解一下的 目录 前言 1. CDN和路由器…...

C语言假期作业 DAY 06

题目 一、选择题 1、以下叙述中正确的是( ) A: 只能在循环体内和 switch 语句体内使用 break 语句 B: 当 break 出现在循环体中的 switch 语句体内时,其作用是跳出该 switch 语句体,并中止循环体的执行 C: continue 语句的作用是&…...

[nlp] tokenizer加速:fast_tokenizer=True

fast_tokenizer 是一个布尔值参数,用于指定是否使用快速的 tokenizer。在某些情况下,使用快速的 tokenizer 可以加快模型训练和推理速度。如果 fast_tokenizer 参数为 True,则会使用快速的 tokenizer;否则,将使用默认的 tokenizer。 快速的 tokenizer 通常使用一些技巧来减…...

基于OpenCV solvePnP函数估计头部姿势

人脸识别 文章目录 人脸识别一、姿势估计概述1、概述2、姿态估计3、在数学上表示相机运动4、姿势估计需要什么5、姿势估计算法6、Levenberg-Marquardt 优化 二、solvePnP函数1、函数原型2、参数详解 三、OpenCV源码1、源码路径 四、效果图像示例参考链接 一、姿势估计概述 1、…...

【杂谈】-递归进化:人工智能的自我改进与监管挑战

递归进化:人工智能的自我改进与监管挑战 文章目录 递归进化:人工智能的自我改进与监管挑战1、自我改进型人工智能的崛起2、人工智能如何挑战人类监管?3、确保人工智能受控的策略4、人类在人工智能发展中的角色5、平衡自主性与控制力6、总结与…...

shell脚本--常见案例

1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件: 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...

练习(含atoi的模拟实现,自定义类型等练习)

一、结构体大小的计算及位段 (结构体大小计算及位段 详解请看:自定义类型:结构体进阶-CSDN博客) 1.在32位系统环境,编译选项为4字节对齐,那么sizeof(A)和sizeof(B)是多少? #pragma pack(4)st…...

Golang dig框架与GraphQL的完美结合

将 Go 的 Dig 依赖注入框架与 GraphQL 结合使用,可以显著提升应用程序的可维护性、可测试性以及灵活性。 Dig 是一个强大的依赖注入容器,能够帮助开发者更好地管理复杂的依赖关系,而 GraphQL 则是一种用于 API 的查询语言,能够提…...

【快手拥抱开源】通过快手团队开源的 KwaiCoder-AutoThink-preview 解锁大语言模型的潜力

引言: 在人工智能快速发展的浪潮中,快手Kwaipilot团队推出的 KwaiCoder-AutoThink-preview 具有里程碑意义——这是首个公开的AutoThink大语言模型(LLM)。该模型代表着该领域的重大突破,通过独特方式融合思考与非思考…...

Java-41 深入浅出 Spring - 声明式事务的支持 事务配置 XML模式 XML+注解模式

点一下关注吧!!!非常感谢!!持续更新!!! 🚀 AI篇持续更新中!(长期更新) 目前2025年06月05日更新到: AI炼丹日志-28 - Aud…...

《基于Apache Flink的流处理》笔记

思维导图 1-3 章 4-7章 8-11 章 参考资料 源码: https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...

是否存在路径(FIFOBB算法)

题目描述 一个具有 n 个顶点e条边的无向图,该图顶点的编号依次为0到n-1且不存在顶点与自身相连的边。请使用FIFOBB算法编写程序,确定是否存在从顶点 source到顶点 destination的路径。 输入 第一行两个整数,分别表示n 和 e 的值(1…...

基于matlab策略迭代和值迭代法的动态规划

经典的基于策略迭代和值迭代法的动态规划matlab代码,实现机器人的最优运输 Dynamic-Programming-master/Environment.pdf , 104724 Dynamic-Programming-master/README.md , 506 Dynamic-Programming-master/generalizedPolicyIteration.m , 1970 Dynamic-Programm…...

AI病理诊断七剑下天山,医疗未来触手可及

一、病理诊断困局:刀尖上的医学艺术 1.1 金标准背后的隐痛 病理诊断被誉为"诊断的诊断",医生需通过显微镜观察组织切片,在细胞迷宫中捕捉癌变信号。某省病理质控报告显示,基层医院误诊率达12%-15%,专家会诊…...