MySQL基础知识——MySQL事务
事务背景
什么是事务?
一组由一个或多个数据库操作组成的操作组,能够原子的执行,且事务间相互独立;
简单来说,事务就是要保证一组数据库操作,要么全部成功,要么全部失败。
注:MySQL是一个支持多引擎的系统,并不是所有的引擎都支持事务。
提到事务,你肯定会想到ACID(Atomicity、 Consistency、 Isolation、 Durability),那么什么是ACID呢?
- 原子性(Atomicity):事务中的操作全部执行,或一个也不执行;
- 隔离性(Isolation):事务的执行独立于其它事务,互不影响;(影响程度根据隔离级别而定)
- 持久性(Durability):事务中的操作完成,则对数据库的影响不会变更,持久保存;
- 一致性(Consistency):事务执行的结果是可预期的,同样的输入一定得出同样的输出;
保证数据一致性,是事务操作的最终目的(AID皆为此);
隔离性与隔离级别
当数据库上有多个事务同时执行的时候, 就可能出现脏读(dirtyread) 、 不可重复读(non-repeatable read) 、 幻读( phantom read) 的问题, 为了解决这些问题, 就有了“隔离级别”的概念。
在谈隔离级别之前, 你首先要知道, 隔离得越严实, 效率就会越低。 因此很多时候, 我们都要在二者之间寻找一个平衡点。
下面对SQL标准的事务隔离级别进行逐一介绍(隔离性由低到高):
- 读未提交(read uncommitted): 一个事务还没提交时, 它做的变更就能被别的事务看到。
- 读提交(read committed): 一个事务提交之后, 它做的变更才会被其他事务看到。
- 可重复读(repeatable read): 一个事务执行过程中看到的数据, 总是跟这个事务在启动时看到的数据是一致的。 当然在可重复读隔离级别下, 未提交变更对其他事务也是不可见的。
- 串行化(serializable): 顾名思义是对于同一行记录, “写”会加“写锁”, “读”会加“读锁”。 当出现读写锁冲突的时候, 后访问的事务必须等前一个事务执行完成, 才能继续执行。
其中“读提交”和“可重复读”比较难理解,下面用一个例子说明这几种隔离级别。
假设数据表T中只有一列, 其中一行的值为1, 下面是按照时间顺序执行两个事务的行为。
mysql> create table T(c int) engine=InnoDB;
insert into T(c) values(1);
接下来,我们看一下在不同隔离级别下,事务A会有哪些不同的返回结果:
- 若隔离级别是“读未提交”, 则V1的值就是2。 这时候事务B虽然还没有提交, 但是结果已经被A看到了。 因此, V2、 V3也都是2。
- 若隔离级别是“读提交”, 则V1是1, V2的值是2。 事务B的更新在提交后才能被A看到。 所以, V3的值也是2。
- 若隔离级别是“可重复读”, 则V1、 V2是1, V3是2。 之所以V2还是1, 遵循的就是这个要求:事务在执行期间看到的数据前后必须是一致的。
- 若隔离级别是“串行化”, 则在事务B执行“将1改成2”的时候, 会被锁住。 直到事务A提交后,事务B才可以继续执行。 所以从A的角度看, V1、 V2值是1, V3的值是2。
在实现上,数据库里面会创建一个视图,访问的时候以视图的逻辑结果为准。
- 在“可重复读”隔离级别下,这个视图是在事务启动时创建的,整个事务存在期间都用这个视图。
- 在“读提交”隔离级别下,这个视图是在每个SELECT语句开始执行的时候创建的。
注1:“读未提交”隔离级别下直接返回记录上的最新值,所以没有视图概念。而“串行化”隔离级别下直接使用加锁的方式来避免并发访问。
注2:不同数据库其默认隔离级别有所差异。Oracle默认隔离界别为“读提交”,因此对于一些从Oracle迁移到MySQL的应用,为保证数据库隔离级别的一致,需要把MYSQL隔离级别设为“读提交”,MySQL默认隔离级别为“可重复读”。
事务隔离的实现
下面以“可重复读”隔离级别为例,介绍事务隔离是怎么实现的。
在MySQL中,实际上每条记录在更新的时候都会记录一条回滚操作。记录上的最新值,通过回滚操作,都可以得到前一个状态值。
假设一个值从1被按顺序改成了2、3、4,在回滚日志里面就会有类似下面的记录:
记录当前值是4,在查询记录时,不同时刻启动的事务会有不同的read-view。在视图A、B、C里面,这一个记录的值分别是1、2、4,同一条记录在系统中可以存在多个版本,就是数据库的多版本并发控制(MVCC);对于read-view A,要得到1,就必须将当前值依次执行图中所有的回滚操作得到。
同时你会发现, 即使现在有另外一个事务正在将4改成5, 这个事务跟read-view A、 B、 C对应的事务是不会冲突的。
问:回滚日志什么时候删除?
当没有事务再需要用到这些回滚段日志时,回滚日志会被删除。即当系统里没有比这个回滚日志更早的read-view的时候。(换句话说,回滚日志一般在当前视图所在事务中才会被用到)
问:为什么建议尽量不要使用长事务?
1)长事务表示系统存在很老的事务视图。这些事务可能访问数据库的任何数据,所以事务提交前,可能用到的回滚记录必须保留,导致回滚记录占用大量存储空间;
2)回滚日志跟数据字典一起放在ibdata文件中,即使长事务提交,回滚段被清理,文件也不会变小。我见过数据只有20GB,而回滚段有200GB的库。最终只好为了清理回滚段,重建整个库。( MySQL
3)长事务还占用锁资源,也可能拖垮整个库;
问:为避免长事务,业务开发和DBA分别应该采取哪些措施?
业务侧:
1)去掉没必要的事务,比如查询语句;
2)设置SQL执行超时时间;
DBA侧:
1)监控 information_schema.Innodb_trx表,设置长事务阈值,超过就报警/或者kill;
2)Percona的pt-kill这个工具不错,推荐使用;
3)在业务功能测试阶段要求输出所有的general_log,分析日志行为提前发现问题;
4)把innodb_undo_tablespaces设置>=2,出现大事务导致回滚段过大,方便清理。(MySQL >= 5.6)
事务的启动方式
autocommit用于决定是否开启事务自动提交:
1)autocommit=0
- 手动提交,当用户执行start transaction/begin时(事务初始化),一个事务开启,当用户执行commit命令时当前事务提交。从用户执行start transaction命令到用户执行commit之间的一系列操作为一个完整的事务周期。回滚事务使用rollback命令;
- 如果为显式通过start transaction/begin开启事务,则会在执行SQL时自动开启一个事务,但不提交;
2)autocommit=1
- 若用户未执行start transaction/begin对数据库进行操作,系统默认用户对数据库的每一个操作为一个孤立的事务,也就是说用户每进行一次操作系都会即时提交或者即时回滚。这种情况下用户的每一个操作都是一个完整的事务周期。
- 若显式执行start transaction/begin,则需要显式提交;情况同autocommit=0;
注:有些客户端连接框架会默认连接成功后先执行一个set autocommit=0的命令。这可能导致接下来的查询都在事务中,如果是长连接,就可能导致了意外的长事务;比如Java的Spring框架,可以显式告诉驱动,是否在事务环境中执行语句。
问:事务在什么时候会被隐式提交?
1)当设置autocommit = 1时,对于已经开启但是未提交的事务,若遇到DDL/begin/lock table/unlock table等语句时,会自动提交上一个事务;
2)当设置autocommit = 0时,对于已经开启但是未提交的事务,若遇到DDL/begin/lock table/unlock table等语句时,会自动回滚上一个事务;
MVCC实现
MVCC在InnoDB引擎层基于read view实现。
问:什么是事务ID?
1)引擎层用于唯一标识事务的ID,在事务开始时由InnoDB事务系统分配,按申请顺序严格递增;越早发起的事务,事务ID越小;
2)begin/start transaction命令不是InnoDB事务的起点,故不会生成事务ID;直到执行变更InnoDB表的语句,才会生成事务ID;
问:什么是数据版本?
1)每行数据有多个版本,按照事务ID倒序排列,每次事务更新数据时,会生成一个新的数据版本,并在版本中记录事务ID,即row trx_id;
2)数据表中的一行记录,可能有多个版本(row),每个版本有自己的row trx_id,可通过遍历拿到对应trx_id的版本;
3)数据版本存放在undo log中,每次查询时根据当前版本和undo log向前推算得出结果。比如,查询V2时,通过V4依次执行V3、V2算出来;
MVCC 并发控制原理详见:MVCC 并发控制原理-源码解析(非常详细)-CSDN博客
相关文章:

MySQL基础知识——MySQL事务
事务背景 什么是事务? 一组由一个或多个数据库操作组成的操作组,能够原子的执行,且事务间相互独立; 简单来说,事务就是要保证一组数据库操作,要么全部成功,要么全部失败。 注:MyS…...

【架构方法论(一)】架构的定义与架构要解决的问题
文章目录 一. 架构定义与架构的作用1. 系统与子系统2. 模块与组件3. 框架与架构4. 重新定义架构:4R 架构 二、架构设计的真正目的-别掉入架构设计的误区1. 是为了解决软件复杂度2. 简单的复杂度分析案例 三. 案例思考 本文关键字 架构定义 架构与系统的关系从业务逻…...

基于springboot实现人口老龄化社区服务与管理系统项目【项目源码+论文说明】计算机毕业设计
基于springboot实现人口老龄化社区服务与管理系统演示 摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了人口老龄化社区服务与管理平台的开发全过程。通过分析人口老龄化社区服务与管理平台方面的不足ÿ…...

代码随想录算法训练营第三十七天| LeetCode 738.单调递增的数字、总结
一、LeetCode 738.单调递增的数字 题目链接/文章讲解/视频讲解:https://programmercarl.com/0738.%E5%8D%95%E8%B0%83%E9%80%92%E5%A2%9E%E7%9A%84%E6%95%B0%E5%AD%97.html 状态:已解决 1.思路 如何求得小于等于N的最大单调递增的整数?98&am…...

C++动态内存管理 解剖new/delete详细讲解(operator new,operator delete)
讨厌抄我作业和不让我抄作业的人 讨厌插队和不让我插队的人 讨厌用我东西和不让我用东西的人 讨厌借我钱和不借给我钱的人 讨厌开车加塞和不让我加塞的人 讨厌内卷和打扰我内卷的人 一、C中动态内存管理 1.new和delete操作内置类型 2.new和delete操作自定义类型 二、operat…...
python-re正则笔记0.2.0
1. 匹配linux文件路径 from re import match, search,findall str"sh refreshConfig.sh /opt/client/ccc.txt /opt/client/ccc.dfs 胜多负少的"patter1"\/.\.\w" print(findall(patter1, str))""" [/opt/client/ccc.txt /opt/client/ccc…...

.NET SignalR Redis实时Web应用
环境 Win10 VS2022 .NET8 Docker Redis 前言 什么是 SignalR? ASP.NET Core SignalR 是一个开放源代码库,可用于简化向应用添加实时 Web 功能。 实时 Web 功能使服务器端代码能够将内容推送到客户端。 适合 SignalR 的候选项: 需要从服…...

【热门话题】常见分类算法解析
🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈| 炫酷HTML | JavaScript基础 💫个人格言: "如无必要,勿增实体" 文章目录 常见分类算法解析1. 逻辑回归(Logistic Regression)2. 朴…...

有效利用MRP能为中小企业带来什么?
在离散制造企业,主流的生产模式主要为面向订单生产和面向库存生产(又称为预测生产),在中小企业中,一般为面向订单生产,也有部分面向库存和面向订单混合的生产方式(以面向订单为主,面…...

InternlM2
第一次作业 基础作业 进阶作业 1. hugging face下载 2. 部署 首先,从github上git clone仓库 https://github.com/InternLM/InternLM-XComposer.git然后里面的指引安装环境...
2024-12.python高级语法
异常处理 首先我们要理解什么叫做**"异常”**? 在程序运行过程中,总会遇到各种各样的问题和错误。有些错误是我们编写代码时自己造成的: 比如语法错误、调用错误,甚至逻辑错误。 还有一些错误,则是不可预料的错误…...

【C语言】贪吃蛇项目(1) - 部分Win32 API详解 及 贪吃蛇项目思路
文章目录 一、贪吃蛇项目需要实现的基本功能二、Win32 API介绍2.1 控制台2.2 部分控制台命令及调用函数mode 和 title 命令COORD 命令GetStdHandle(获取数据)GetConsoleCursorInfo(获取光标数据)SetConsoleCursorInfo (…...

秋叶Stable diffusion的创世工具安装-带安装包链接
来自B站up秋葉aaaki,近期发布了Stable Diffusion整合包v4.7版本,一键在本地部署Stable Diffusion!! 适用于零基础想要使用AI绘画的小伙伴~本整合包支持SDXL,预装多种必须模型。无需安装git、python、cuda等任何内容&am…...

华为ensp中aaa(3a)实现telnet远程连接认证配置命令
作者主页:点击! ENSP专栏:点击! 创作时间:2024年4月14日18点49分 AAA认证的全称是Authentication、Authorization、Accounting,中文意思是认证、授权、计费。 以下是详细解释 认证(Authentic…...
前端网络---http协议和https协议的区别
http协议和https的区别 1、http是超文本传输协议,信息是明文传输,https则是具有安全性的ssl加密传输协议。 2、http和https使用的端口不一样,http是80,https是443。 3、http的连接很简单,是无状态的(可以…...

FactoryMethod工厂方法模式详解
目录 模式定义实现方式简单工厂工厂方法主要优点 应用场景源码中的应用 模式定义 定义一个用于创建对象的接口,让子类决定实例化哪一个类。 Factory Method 使得一个类的实例化延迟到子类。 实现方式 简单工厂 以下示例非设计模式,仅为编码的一种规…...
Java基础-知识点1(面试|学习)
Java基础-知识点1 Java与C、PythonJava :C:Python: java 与 C的异同相似之处:区别: Java8的新特性Lambda 表达式:Stream API:接口的默认方法和静态方法: 基本数据类型包装类自动装箱与自动拆箱自…...

【InternLM 实战营第二期-笔记1】书生浦语大模型开源体系详细介绍InternLM2技术报告解读(附相关论文)
书生浦语是上海人工智能实验室和商汤科技联合研发的一款大模型,很高兴能参与本次第二期训练营,我也将会通过笔记博客的方式记录学习的过程与遇到的问题,并为代码添加注释,希望可以帮助到你们。 记得点赞哟(๑ゝω╹๑) 书生浦语大模型开源体系…...

【免费】基于SOE算法的多时段随机配电网重构方法
1 主要内容 该程序是完全复现《Switch Opening and Exchange Method for Stochastic Distribution Network Reconfiguration》,也是一个开源代码,网上有些人卖的还挺贵,本次免费分享给大家,代码主要做的是一个通过配电网重构获取…...
Swift面向对象编程
类的定义与实例化: Swift中定义一个类使用class关键字,类的属性和方法都写在大括号内。示例代码如下: class MyClass {var property1: Intvar property2: Stringinit(property1: Int, property2: String) {self.property1 property1self.pr…...

铭豹扩展坞 USB转网口 突然无法识别解决方法
当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…...

Chapter03-Authentication vulnerabilities
文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...

Flask RESTful 示例
目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务 中文乱码问题: 下面创建一个简单的Flask RESTful API示例。首先,我们需要创建环境,安装必要的依赖,然后…...

Linux相关概念和易错知识点(42)(TCP的连接管理、可靠性、面临复杂网络的处理)
目录 1.TCP的连接管理机制(1)三次握手①握手过程②对握手过程的理解 (2)四次挥手(3)握手和挥手的触发(4)状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...

【机器视觉】单目测距——运动结构恢复
ps:图是随便找的,为了凑个封面 前言 在前面对光流法进行进一步改进,希望将2D光流推广至3D场景流时,发现2D转3D过程中存在尺度歧义问题,需要补全摄像头拍摄图像中缺失的深度信息,否则解空间不收敛…...

Java-41 深入浅出 Spring - 声明式事务的支持 事务配置 XML模式 XML+注解模式
点一下关注吧!!!非常感谢!!持续更新!!! 🚀 AI篇持续更新中!(长期更新) 目前2025年06月05日更新到: AI炼丹日志-28 - Aud…...

SpringCloudGateway 自定义局部过滤器
场景: 将所有请求转化为同一路径请求(方便穿网配置)在请求头内标识原来路径,然后在将请求分发给不同服务 AllToOneGatewayFilterFactory import lombok.Getter; import lombok.Setter; import lombok.extern.slf4j.Slf4j; impor…...
爬虫基础学习day2
# 爬虫设计领域 工商:企查查、天眼查短视频:抖音、快手、西瓜 ---> 飞瓜电商:京东、淘宝、聚美优品、亚马逊 ---> 分析店铺经营决策标题、排名航空:抓取所有航空公司价格 ---> 去哪儿自媒体:采集自媒体数据进…...
rnn判断string中第一次出现a的下标
# coding:utf8 import torch import torch.nn as nn import numpy as np import random import json""" 基于pytorch的网络编写 实现一个RNN网络完成多分类任务 判断字符 a 第一次出现在字符串中的位置 """class TorchModel(nn.Module):def __in…...

HashMap中的put方法执行流程(流程图)
1 put操作整体流程 HashMap 的 put 操作是其最核心的功能之一。在 JDK 1.8 及以后版本中,其主要逻辑封装在 putVal 这个内部方法中。整个过程大致如下: 初始判断与哈希计算: 首先,putVal 方法会检查当前的 table(也就…...