MySql之binlog与数据恢复(Binlog and Data Recovery in MySQL)
MySql之binlog与数据恢复
什么是binlog
binlog我们一般叫做归档日志,他是mysql服务器层的日志,跟存储引擎无关,他记录的是所有DDL和DML的语句,不包含查询语句,binlog是一种逻辑日志,他记录的是sql语句的原始逻辑,binlog写满后会切换到下一个日志继续写,不会覆盖以前的日志。mysql8版本之后是默认是开的,这之前的版本需要我们手动的开启。
-
DDL(Data Definition Language):数据库定义语言,主要用于定义和管理数据库的结构,包括创建,修改,删除库,表,视图,索引等,DDL的常用命令CREATE,ALTER ,DROP等。
-
DML(Data Manipulation Language) :数据库操作语言,用于对数据的操作,包括查询,插入,修改,删除等,DML常用的命令INSERT,UPDATE,DELETE等
binlog的作用
binlog主要有两个作用:
-
MySql主从复制:主机开启binlog,主机会将binlog同步复制该从节点,从节点通过读取binlog来同步主节点的数据
-
mysql的数据恢复:通过使用binlog工具结合binlog可以将数据恢复到数据库某一时刻
binlog的三种模式
基于SQL语句的复制(statement-based replication, SBR),基于行的复制(row-based replication, RBR),混合模式复制(mixed-based replication, MBR)。对应的,binlog的格式也有三种:STATEMENT,ROW,MIXED。
① STATEMENT模式(SBR) 每一条会修改数据的sql语句会记录到binlog中。优点是并不需要记录每一条sql语句和每一行的数据变化,减少了binlog日志量,节约IO,提高性能。缺点是在某些情况下会导致master-slave中的数据不一致(如sleep()函数, last_insert_id(),以及user-defined functions(udf)等会出现问题)
② ROW模式(RBR) 不记录每条sql语句的上下文信息,仅需记录哪条数据被修改了,修改成什么样了。而且不会出现某些特定情况下的存储过程、或function、或trigger的调用和触发无法被正确复制的问题。缺点是会产生大量的日志,尤其是alter table的时候会让日志暴涨。
③ MIXED模式(MBR) 以上两种模式的混合使用,一般的复制使用STATEMENT模式保存binlog,对于STATEMENT模式无法复制的操作使用ROW模式保存binlog,MySQL会根据执行的SQL语句选择日志保存方式。
binlog的开启
mysql> show variables like '%log_bin%';

默认是没有开启的,所以需要开启,需要编辑/etc/my.cnf 配置文件
#开启bin 日志log-bin=mysql-bin#服务器标志号,注意在配置文件中不能出现多个这样的标识,如果出现多个的话mysql以第一个为准,一组主从中此标识号不能重复。server-id=1#开启bin-log,并指定文件目录和文件名前缀。log-bin=/home/mysql/logs/binlog/bin-log# 每个bin-log最大大小,当此大小等于500M时会自动生成一个新的日志文件。一条记录不会写在2个日志文件中,所以有时日志文件会超过此大小。max_binlog_size=500M#日志缓存大小binlog_cache_size=128K#需要同步的数据库名字,如果是多个,就以此格式再写一行即可binlog-do-db=syn_test#不需要同步的数据库名字,如果是多个,就以此格式再写一行即可。#binlog-ignore-db=mysql#当Slave从Master数据库读取日志时更新写入日志中,如果只启动log-bin 而没有启动log-slave-updates则Slave只记录针对自己数据库操作的更新。log-slave-updatesexpire_logs_day=7 #设置bin-log日志文件保存的天数,此参数mysql5.0以下版本不支持。binlog_format="MIXED" #设置bin-log日志文件格式为:MIXED,可以防止主键重复
然后重启mysql 即可 systemctl mysqld resteart
也可以查看当前的模式:
mysql> show variables like '%binlog_format%';

这个时候操作syn_test的话就有日志了,但是生成的日志是二进制的,我们需要工具mysqlbinlog来查看:
[root@node03 mysql]# mysqlbinlog master-bin.000004

使用myslq的命令可以查看:
mysql> show binlog events in 'master-bin.000004'

在这里插入图片描述
数据的恢复与回滚
恢复数据库中的数据的话,指定位置即可:
mysqlbinlog mysql-bin.000009 --start-position 154 --stop-position 755 | mysql -uroot -p mytest
或者可以根据时间将日志转为我们可以看的懂的sql:
mysqlbinlog --no-defaults --base64-output=decode-rows -v--start-datetime="2023-12-12 00:00:00"--stop-datetime="2023-12-28 00:00:00" mysql-bin.000001 > output.txt
特别需要注意的是binlog通常是用来做数据恢复,而不是回滚,比如说0点数据库备份之后,到早上7点数据库损坏,那么可以根据binlog恢复0点到7点的所有操作数据,因为binlog下大部分记录的是sql语句,那就可以按照sql语句执行一遍即可,如果是数据回滚,在STATEMENT和MIXED模式下,update了某一个数据或者delete数据,binlog记录只是update和delete语句,那么update和delete的完整数据就不存在了,所以没办法进行数据的回滚。在row模式下,必须是binlog_row_image为full的情况下,update和delete是有记录详细的update信息的,是可以回滚的。比如在row模式执行下面语句
update teacher set t_name = '小七' WHERE t_id = '04';delete from teacher WHERE t_id = '04';使用mysqlbinlog:mysqlbinlog --base64-output=decode-rows -v mysql-bin.000036 > test.sql在ROW模式下使用mysqlbinlog要添加参数--base64-output=decode-rows 否则看不懂

我们只需要将数据还原回去就可以了,比如DELETE改为INSERT,update则是where和set互换等。这个日志中有记录事务的具体ID的,比如说XID=680,这个在事务中非常用,用于保证事务的持久性,这个需要和数据库引擎产生的日志redolog一起使用,这又涉及到了两阶段提交的概念,这个redolog后面再说。
binlog_row_image 这个参数是在基于行复制的情况下必要的参数,用于控制行镜像(row images)是如何写入到二进制日志(binlog)中,包含FULL,MINIMAL和 NOBLOB。
FULL模式下会记录更改前后的值。
MINMAL只记录行数据的最小部分默认情况下不知道是不是这个值,默认情况下我测试出来没有找打update具体的值,只看到有个操作。
NOBLOB类似语句FULL模式,但是BLOD和TEXT这种字段可能不记录,在没有BLOD和TEXT的情况下和FULL没有区别, 默认情况不写binlog_row_image这个参数的情况下,日志是下面这中:
BEGIN/*!*/;# at 295#241010 15:53:14 server id 1 end_log_pos 354 CRC32 0x39c16fbf Table_map: `syn_test`.`teacher` mapped to number 427# at 354#241010 15:53:14 server id 1 end_log_pos 400 CRC32 0x107e5e6b Write_rows: table id 427 flags: STMT_END_F# at 400#241010 15:53:14 server id 1 end_log_pos 431 CRC32 0x157bc910 Xid = 318COMMIT/*!*/;# at 431#241010 15:55:06 server id 1 end_log_pos 496 CRC32 0xe0e36b12 Anonymous_GTID last_committed=1 sequence_number=2SET @@SESSION.GTID_NEXT= 'ANONYMOUS'/*!*/;# at 496#241010 15:55:06 server id 1 end_log_pos 572 CRC32 0x76eabfdf Query thread_id=16 exec_time=0 error_code=0SET TIMESTAMP=1728546906/*!*/;BEGIN/*!*/;# at 572#241010 15:55:06 server id 1 end_log_pos 631 CRC32 0x5e8da5ca Table_map: `syn_test`.`teacher` mapped to number 427# at 631#241010 15:55:06 server id 1 end_log_pos 689 CRC32 0x4eb2b41a Update_rows: table id 427 flags: STMT_END_F# at 689#241010 15:55:06 server id 1 end_log_pos 720 CRC32 0x5a8ed720 Xid = 842COMMIT/*!*/;SET @@SESSION.GTID_NEXT= 'AUTOMATIC' /* added by mysqlbinlog */ /*!*/;DELIMITER ;# End of log file/*!50003 SET COMPLETION_TYPE=@OLD_COMPLETION_TYPE*/;/*!50530 SET @@SESSION.PSEUDO_SLAVE_MODE=0*/
你会发现根本没有具体的相关信息,那就没办法恢复了。回滚数据在少数的情况下我们可以手动的去还原,但是多的话,那就麻烦了,这就需要用到第三方工具了比如开源工具binlog2sql ,美团开源的闪回工具MyFlash等。
binlog日志的删除
手动删除:rest master 删除全部的日志,删除之后,日志从00001开始记录
purge master logs to 'binlog.xxxxx' 删除xxx之前的日志purge master logs before 'yyyy-mm-dd hh24:mi:ss' 删除yyyy-mm-dd hh24:mi:ss之前的日志
自动删除:
-
设置过期时间:可以通过设置expire_logs_days参数来自动删除旧的binlog文件。这个参数定义了MySQL清除过期日志的时间,默认值为0,表示不自动删除。例如,设置expire_logs_days=7表示只保留最近7天的binlog文件
-
设置binlog文件大小:通过max_binlog_size参数可以限制单个binlog文件的最大大小,当超过这个大小时,会自动创建新的binlog文件
-
对于MySQL 8.0及以上版本,建议使用binlog_expire_logs_seconds参数来设置binlog的过期时间,单位是秒。例如,设置binlog_expire_logs_seconds=604800表示binlog文件在7天后过期
相关文章:
MySql之binlog与数据恢复(Binlog and Data Recovery in MySQL)
MySql之binlog与数据恢复 什么是binlog binlog我们一般叫做归档日志,他是mysql服务器层的日志,跟存储引擎无关,他记录的是所有DDL和DML的语句,不包含查询语句,binlog是一种逻辑日志,他记录的是sql语句的原…...
JDK1.8和Maven、Git安装教程自用成功
一.JDK安装 JRK:java运行环境 JDK:java语言的软件开发工具包;JDK里包含了java开发工具,也包含了JRE 1.下载JDK1.8并安装 Java Downloads | Oracle 进入官网后往下翻,找到JAVA8; 然后选择对应的版本&am…...
数据采集助力AI大模型训练
引言使用抓取浏览器采集ebay商品页面选购亮数据AI训练数据总结 引言 AI技术在今天已经是我们工作生活中不可或缺的工具,很多小伙伴也在致力于训练AI模型。高质量的数据是训练强大AI模型的核心驱动力,无论是自然语言处理、计算机视觉还是推荐系统…...
WPF中viewmodel单例模式
1、单例模式介绍 单例模式是一种创建型设计模式,确保一个类只有一个实例,并提供一个全局访问点来获取这个实例。它常用于需要全局唯一访问点的场景,如配置管理、日志记录、数据库连接等。 2、WPF 中 ViewModel 的单例实现 在 WPF 中&#…...
Rust 为什么不适合开发 GUI
前言 在当今科技蓬勃发展的时代,Rust 编程语言正崭露头角,逐步为世界上诸多重要基础设施提供动力支持。从存储海量信息到应用于 Linux 内核,Rust 展现出强大的实力。然而,当涉及构建 GUI(图形用户界面)时&…...
消息队列篇--通信协议篇--理解HTTP、TLS和TCP如何协同工作
前面介绍了HTTP/HTTPS,SSL/TLS以及TCP和UDP,这些在网络传输上分别有着自己的作用。为了深入理解下这些概念,本篇重点介绍下HTTP、TLS 和 TCP是如何协同工作的?我们从底层到上层逐步分析每个协议的作用及其相互关系。这些协议共同协…...
代码随想录算法训练营第三十四天 | 62.不同路径 63.不同路径II 343.整数拆分
62.不同路径 题目链接:62. 不同路径 - 力扣(LeetCode) 文章讲解:代码随想录 视频讲解:动态规划中如何初始化很重要!| LeetCode:62.不同路径_哔哩哔哩_bilibili 思路:机器人位于一…...
2023第十四届蓝桥杯大赛软件赛省赛C/C++ 大学 B 组(真题题解)(C++/Java题解)
记录刷题的过程、感悟、题解。 希望能帮到,那些与我一同前行的,来自远方的朋友😉 大纲: 1、日期统计-(解析)-暴力dfs(😉蓝桥专属 2、01串的熵-(解析)-不要chu…...
RK3568-适配ov5647摄像头
硬件原理图 CAM_GPIO是摄像头电源控制引脚,连接芯片GPIO4_C2 CAM_LEDON是摄像头led灯控制引脚,连接芯片GPIO4_C3编写设备树 / {ext_cam_clk: external-camera-clock {compatible = "fixed-clock";clock-frequency = <25000000>;clock-output-names = "…...
Java的设计模式详解
摘要:设计模式是软件工程中解决常见问题的经典方案。本文结合Java语言特性,深入解析常用设计模式的核心思想、实现方式及实际应用场景,帮助开发者提升代码质量和可维护性。 一、设计模式概述 1.1 什么是设计模式? 设计模式&…...
实战篇Redis
黑马程序员的Redis的笔记(后面补一下图片) 【黑马程序员Redis入门到实战教程,深度透析redis底层原理redis分布式锁企业解决方案黑马点评实战项目】https://www.bilibili.com/video/BV1cr4y1671t?p72&vd_source001f1c33a895eb5ed820b9a4…...
化学方程式配平 第33次CCF-CSP计算机软件能力认证
很经典的大模拟题目 但是还不算难 大模拟题最需要注意的就是细节 写代码一定要考虑全面 并且要细心多debug 多打断点STL库的熟练使用 istringstream真的处理字符串非常好用 注意解耦合思想 这样改代码debug更加清晰 https://www.acwing.com/problem/content/5724/ #includ…...
Java基础-25-继承-方法重写-子类构造器的特点-构造器this的调用
在面向对象编程中,继承是实现代码复用和扩展的重要机制。通过继承,子类可以继承父类的属性和方法,并且可以通过方法重写来改变或扩展父类的行为。此外,构造器在对象初始化过程中扮演了重要角色,尤其是在子类构造器中如…...
nvidia 各 GPU 架构匹配的 CUDA arch 和 CUDA gencode
使用 NVCC 进行编译 cuda c(.cu)时,arch 标志 (-arch) 指定了 CUDA 文件将为其编译的 NVIDIA GPU 架构的名称。 Gencodes (-gencode) 允许更多的 PTX 代,并且可以针对不同的架构重复多次。 NVIDIA 架构名称的列表,以及它们具有的计算能力&am…...
沉浸式体验测评|AI Ville:我在Web3小镇“生活”了一周
最近,我在朋友的推荐下,体验了 aivillebot 的项目。起初,我只是抱着试试看的心态,心想这不就是个 Web3 版的《星露谷物语》吗? 但是一周下来,我发现这个虚拟小镇也没那么简单——里面的居民不是目前端游或链…...
TTL 值 | 在 IP 协议、ping 工具及 DNS 解析中的作用
注:本文为 “TTL” 相关文章合辑。 未整理去重。 如有内容异常,请看原文。 TTL 值的意义 2007-10-18 11:33:17 TTL 是 IP 协议包中的一个值,用于标识网络路由器是否应丢弃在网络中停留时间过长的数据包。数据包可能因多种原因在一定时间内…...
人工智能之数学基础:初等反射阵
本文重点 在线性代数中,初等反射阵(Householder矩阵)作为一类特殊的正交矩阵,在矩阵变换、特征值计算及几何变换等领域具有广泛应用。其简洁的构造方式和丰富的数学性质,使其成为数值分析和几何处理中的重要工具。 什么是初等反射阵(豪斯霍尔德变换) I为单位矩阵,wwT…...
4.1 代码随想录第三十二天打卡
准备:完全背包理论基础-二维DP数组 1.完全背包就是同一物品可以往里多次装 2.这里先遍历背包 或物品都可以 3.dp[i][j] 表示从下标为[0-i]的物品,每个物品可以取无限次,放进容量为j的背包,价值总和最大是多少 518.零钱兑换II (1)题目描述…...
SQL Server:数据库镜像端点检查
目录标题 **1. 端点的作用****2. 检查的主要内容****(1)端点是否存在****(2)端点状态****(3)协议与端口****(4)权限配置** **3. 操作步骤(示例)****ÿ…...
【区块链安全 | 第九篇】基于Heimdall设计的智能合约反编译项目
文章目录 背景目的安装1、安装 Rust2、克隆 heimdall-dec3、编译 heimdall-dec4、运行 heimdall-dec 使用说明1、访问 Web 界面2、输入合约信息3、查看反编译结果 实战演示1、解析普通合约2、解析代理合约 背景 在区块链安全研究中,智能合约的审计和分析至关重要。…...
【Easylive】TokenUserInfoDto中@JsonIgnoreProperties和 Serializable 接口作用
【Easylive】项目常见问题解答(自用&持续更新中…) 汇总版 这段代码定义了一个名为 TokenUserInfoDto 的 DTO(数据传输对象),用于封装用户令牌信息。以下是对 JsonIgnoreProperties 和 Serializable 接口作用的详…...
k8s EmptyDir(空目录)详解
1. 定义与特性 emptyDir 是 Kubernetes 中一种临时存储卷类型,其生命周期与 Pod 完全绑定。当 Pod 被创建时,emptyDir 会在节点上生成一个空目录;当 Pod 被删除时,该目录及其数据会被永久清除。它主要用于同一 Pod 内多个容器间的…...
毕业设计:实现一个基于Python、Flask和OpenCV的人脸打卡Web系统(六)
毕业设计:实现一个基于Python、Flask和OpenCV的人脸打卡Web系统(六) Flask Flask是一个使用 Python 编写的轻量级 Web 应用框架。其 WSGI 工具箱采用 Werkzeug ,模板引擎则使用 Jinja2 。Flask使用 BSD 授权。 Flask也被称为 “microframework” ,因为它使用简单的核心,…...
洛谷题单2-P5717 【深基3.习8】三角形分类-python-流程图重构
题目描述 给出三条线段 a , b , c a,b,c a,b,c 的长度,均是不大于 10000 10000 10000 的正整数。打算把这三条线段拼成一个三角形,它可以是什么三角形呢? 如果三条线段不能组成一个三角形,输出Not triangle;如果是…...
批量删除 txt/html/json/xml/csv 等文本文件空白行
我们常常会遇到需要删除 txt 文本文件中空白行的情况,如果文本文件较大,行数较多的时候,有些空白行不容易人工识别,这使得删除文本文件空白行变得非常繁琐,我们需要先找到空白的行,然后才能进行删除操作。尤…...
MySQL数据库中,tinyint(1) 和 tinyint 有什么区别
TINYINT(1) 和 TINYINT 的区别 在 MySQL 中,TINYINT(1) 和 TINYINT 本质上是相同的数据类型,但 TINYINT(1) 中的 (1) 实际上不会影响存储大小或取值范围。 1. TINYINT 及其取值范围 TINYINT 是 MySQL 中最小的整数类型,占用 1 个字节 (8 bi…...
android databinding使用教程
Android DataBinding 是一种可以将 UI 组件与数据源绑定的框架,能够减少 findViewById 的使用,并提高代码的可维护性。下面是 DataBinding 的完整使用教程: 1. 启用 DataBinding 在 build.gradle(Module 级别)中启用 …...
【FreeRtos】任务调度器可以被挂起吗?
1. 省流回答 FreeRTOS的任务调度器可以被挂起(Suspend)。 通过调用API函数 vTaskSuspendAll(),可以临时禁止任务调度器的运行,此时系统将不再进行任务切换(包括抢占式调度和时间片轮转),但中断…...
ES5内容之String接口
注意:slice、substr、substring 都接受一个或两个参数,第一个参数指定字符串的开始位置,第二个参数表示子字符串到哪里结束,slice 和 substring 的第二个参数指定的是子字符串的最后一个字符后面的位置,substr 第二个参…...
k8s运维面试总结(持续更新)
一、你使用的promethues监控pod的哪些指标? CPU使用率 内存使用率 网络吞吐量 磁盘I/O 资源限制和配额:Prometheus可以监控Pod的资源请求和限制,确保它们符合预设的配额,防止资源过度使用。具体指标如container_spec_cpu_quota用于…...
