当前位置: 首页 > news >正文

数据库系统概论:事务与并发一致性问题

随着网络应用的普及,数据库并发问题变得越来越重要。数据库并发指的是多个用户或进程同时访问和操作数据库的能力。它是数据库系统性能优化的重要方面,旨在提高系统的吞吐量和响应时间,以满足多用户同时访问数据库的需求。然而,这种能力也带来了数据一致性隔离性性能等方面的挑战。

事务

事务(Transaction)是指一系列数据库操作组成的逻辑单元,是并发控制的基本单位。事务具有(ACID特性)原子性一致性隔离性持久性等属性,是保证数据一致性和事务并发控制的重要手段。

![[事务]]

在关系数据库中,一个事务可以是一条 SQL 语句、一组 SQL 语句或整个程序。事务和程序是两个概念。一般地讲,一个程序中包含多个事务。事务的开始与结束可以由用户显式控制。如果用户没有显式地定义事务,则由数据库管理系统按默认规定自动划分事务。

ACID

ACID 是指数据库事务的四个特性:

  • 原子性 (Atomicity)
  • 一致性 (Consistency)
  • 隔离性 (Isolation)
  • 持久性 (Durability)。

这些特性保证了在事务中,所有操作要么全部成功提交(COMMIT),要么全部撤销回滚(ROLLBACK),不允许只部分执行,并且数据库始终处于一致性状态,即使系统故障或者其他异常情况也不会破坏数据的完整性

  • 原子性 (Atomicity):确保了事务中的所有操作不可分割,要么全部提交成功,要么全部失败回滚。

    回滚可以用日志来实现,日志记录着事务所执行的修改操作,在回滚时反向执行这些修改操作即可

  • 一致性 (Consistency):表示事务必须把数据库从一个一致状态转变为另一个一致状态。在一致性状态下,所有事务对一个数据的读取结果都是相同的。

    • 当数据库只包含成功事务提交的结果时,就说数据库处于一致性状态。

    • 如果数据库系统运行中发生故障,有些事务尚未完成就被迫中断,这些未完成的事务对数据库所做的修改有一部分已写入物理数据库,这时数据库就处于一种不正确的状态(不一致的状态)。

  • 隔离性 (Isolation):确保了多个事务并发执行时不会相互干扰,即一个事务所做的修改在最终提交前,对其他事务是不可见的。

    如果一项操作无法完成或出现了意外故障,整个事务就会失败,并且所有对数据库所做的修改都会被回滚。

  • 持久性 (Durability):是指一旦事务提交,其执行的结果就会持久保存到数据库中,不会因系统故障、崩溃或其他错误导致执行数据丢失。

    可以通过数据库备份和恢复来实现,在系统发生崩溃时,使用备份的数据库进行数据恢复。

要保证事务的正确性和数据的一致性,需要在编写数据库操作时遵循一些基本的事务处理原则,例如保证事务的独立性、粒度合理、尽量减少锁竞争等。

事务特性的关系

ACID 的四个特性是相互关联和互相依赖的

  • 只有满足一致性,事务的执行结果才是正确的。

  • 在无并发的情况下,事务串行执行,隔离性一定能够满足。此时只要能满足原子性,就一定能满足一致性。

  • 在并发的情况下,多个事务并行执行,事务不仅要满足原子性,还需要满足隔离性,才能满足一致性。

  • 事务满足持久化是为了能应对数据库崩溃的情况。

![[Pasted image 20231214163656.png]]

事务运行方式

事务的运行方式主要分为两种方式:

  • 串行每个时刻只有一个事务运行

    串行的优点是实现简单,容易保证事务的一致性;但缺点是效率低。

  • 并行同一时刻可以有多个事务同时运行

    并行的优点是效率高,可提高整个系统的吞吐量,减少平均响应时间;但缺点是会导致数据库的不一致性。

在单处理系统中,所谓的并行实际上是宏观上的并行运行,微观上的串行运行,即交叉并发

允许多个用户同时使用同一个数据库的数据库系统称为多用户数据库系统,在这种系统中,同一时刻并发运行的事务数量相当庞大。

假设有两个事务 S S S T T T,其中 S S S m m m 条指令, T T T n n n 条指令,且每个事务内部指令的相对顺序不能错乱,那么可能的执行顺序有 R R R 种: R = C m + n m = C m m + n = ( m + n ) ! m ! n ! R=C^m_{m+n} = C^{m+n}_m=\frac{(m+n)!}{m!n!} R=Cm+nm=Cmm+n=m!n!(m+n)!

调度

调度事务的一次执行顺序称为一个调度,表示事务的指令在系统中执行的时间顺序,一组事务的调度必须保证:包含了所有事务的操作指令、一个事务中指令的顺序必须保持不变。

调度又分为串行调度和并行调度:

  • 串行调度:属于同一事务的指令紧挨在一起执行,对于有 n n n 个事务的事务组,可以有 n ! n! n! 个有效调度

  • 并发调度:来自不同事务的指令可以交叉执行。并发调度有可能会导致错误结果,仅当并发调度等价于某个串行调度时,则称该并发调度时可串行化的、正确的。

并发一致性问题

在并发环境下,可能会出现并发一致性问题,并发一致性问题是指在数据库或分布式系统中,当多个事务或操作并发执行时,由于事务的隔离性难以完全保证,导致数据的一致性和完整性受到破坏的现象

这些问题主要包括 脏读不可重复读幻读 以及 丢失修改 等,可能导致数据库中的数据变得不一致。

读脏数据

脏读(Dirty Read):通常情况下,读取数据的事务会等待修改数据的事务提交,以便确保数据的一致性。一个事务读取了另一个未提交的事务所做的修改,然后在另一个事务回滚时,读取的数据就变得无效、不一致。脏读可能导致不可靠的数据和错误的决策。

![[Pasted image 20231214164440.png]]

脏读可能导致严重的问题,它可能会使应用程序基于错误的数据做出错误的决策。例如,如果一个银行应用程序在脏数据的情况下对银行帐户余额进行计算,则可能会导致银行资金的混乱。

不可重复读

不可重复读(Non-repeatable Read):一个事务在同一查询中多次读取同一行数据时,得到的结果不一致。在同一个事务,读取的过程中,由于其他事务修改了数据,同一查询可能返回不同的结果。

![[Pasted image 20231214164728.png]]

情况实例:

  1. 事务 A 开始并执行 SELECT 语句,读取了某一行的数据。

  2. 事务 B 修改了该行数据,并提交事务。

  3. 事务 A 再次执行相同的 SELECT 语句,读取同一行数据,但是此时得到的结果与之前读取的结果不一致。

不可重复读可能对应用程序逻辑造成困扰,可能导致数据的不一致,特别是对于需要多次读取数据并进行比较或计算的场景。

例如,一个订单系统中,一个事务读取了某个订单的金额,在执行过程中,另一个事务对订单金额进行了修改,导致两次读取的金额不一致,进而影响了订单的计算结果。

幻读

幻读(Phantom Read):在同一个事务中,同一查询多次执行,得到的结果集不一致。这是因为在读取的过程中,其他事务插入或删除了符合查询条件的数据。导致再次执行同一查询时出现新的数据行或少了一些数据行。

可以理解为,幻读 是一种比 不可重复读 更严重的数据不一致情况。

![[Pasted image 20231214165024.png]]

  1. 事务A 开始并执行 SELECT 语句,读取了表中的某几行数据。

  2. 事务B 插入了符合查询条件的一行数据,并提交事务。

  3. 事务A 再次执行相同的 SELECT 语句,读取相同的几行数据,但是此时得到的结果集中出现了新的一行数据,事务A 读取到的就是脏数据。

幻读可能导致数据的不完整。在高并发环境下,串行化隔离级别可能导致性能问题。因此,需要根据具体的业务需求和性能考量选择合适的隔离级别,以避免幻读的问题。

与不可重复读相比,幻读主要是针对批量数据的插入和删除操作,不仅会导致对数据的读取不一致,还可以对其它业务操作造成一定的困扰。

例如,在一个网上商城系统中,一个事务读取某一类商品的所有库存,使用返回的结果更新了前端页面的销售数量,此时,客户来了几个下单,由不同的事务进行插入操作,导致前端页面展示的库存数量不一致,进而影响了用户体验和商城的信誉。

丢失更新

丢失更新(Lost Update):由于并发事务的执行,两个事务同时对相同的数据执行更新操作,但是其中一个事务的更新结果被另一个事务覆盖,从而丢失了其中一个事务的更新。这可能导致数据的丢失和覆盖。

![[Pasted image 20231214165442.png]]

当多个事务同时对同一数据进行修改时,如果不采取适当的并发控制措施,就可能导致丢失更新的问题:

  1. 事务A 读取一行数据,并将其存储在本地缓存中。

  2. 事务B 读取同一行数据,也将其存储在本地缓存中。

  3. 事务A 修改了该行数据,并将其更新到数据库中。

  4. 事务B 修改相同行数据,此时使用的是之前读取到的旧值,然后将其更新到数据库中。

  5. 结果是事务B 的修改覆盖了事务A 的修改,事务A的更新操作被丢失。

这种情况下,事务B 覆盖了事务A 的更新,最终导致数据的一致性问题。

相关文章:

数据库系统概论:事务与并发一致性问题

随着网络应用的普及,数据库并发问题变得越来越重要。数据库并发指的是多个用户或进程同时访问和操作数据库的能力。它是数据库系统性能优化的重要方面,旨在提高系统的吞吐量和响应时间,以满足多用户同时访问数据库的需求。然而,这…...

Python编程基础:元组类型、字典类型、集合类型

目录 元组类型创建/删除元组访问/操作元组元组生成式字典类型创建/删除字典访问/操作字典字典相关函数集合类型创建/删除集合集合相关操作符访问/操作集合元组类型 元组是Python中内置的不可变序列,这是它跟列表的不同之处,它没有一系列增删改等操作,只可以使用索引和for循环…...

day2 单机并发缓存

文章目录 1 sync.Mutex2 支持并发读写3 主体结构 Group3.1 回调 Getter3.2 Group 的定义3.3 Group 的 Get 方法 4 测试 本文代码地址: https://gitee.com/lymgoforIT/gee-cache/tree/master/day2-single-node 本文是7天用Go从零实现分布式缓存GeeCache的第二篇。 …...

ECMP等价多路由机制,大模型训练负载均衡流量极化冲突原因,万卡(大规模)集群语言模型(LLM)训练流量拥塞特点

大规模集群,大语言模型(LLM)训练流量特点,ECMP(Equal-Cost Multi-Path Routing)流量极化拥塞原因。 视频分享在这: 2.1 ECMP等价多路由,大模型训练流量特点,拥塞冲突极化产生原因_哔哩哔哩_bi…...

Linux 注意事项

Linux 与 Windows 是两个相互独立的操作系统,两者有较大差距: 1.1 Linux 严格区分大小写(Windows不严格区分大小写); 1.2 Linux 中所有内容,硬件设备都以文件形式保存在 /dev 目录下(万物皆文件…...

力扣SQL50 指定日期的产品价格 双重子查询 coalesce

Problem: 1164. 指定日期的产品价格 coalesce 的使用 简洁版 &#x1f468;‍&#x1f3eb; 参考题解 select distinct p1.product_id,coalesce((select p2.new_pricefrom Products p2where p2.product_id p1.product_id and p2.change_date < 2019-08-16order by p2.…...

MySQL8的备份方案——全量(完全)备份(CentOS)

MySQL8的全量备份 一、安装备份工具二、备份数据三、恢复备份 点击跳转增量备份 点击跳转差异备份 点击跳转压缩备份 一、安装备份工具 官网 下载地址 备份所用工具为percona-xtrabackup 如果下方安装工具的教程失效&#xff0c;请点击上方下载地址转到官方文档查看 下载该工…...

JVM监控及诊断工具-命令行篇--jcmd命令介绍

JVM监控及诊断工具-命令行篇5-jcmd&#xff1a;多功能命令行 一 基本情况二 基本语法jcmd -ljcmd pid helpjcmd pid 具体命令 一 基本情况 在JDK 1.7以后&#xff0c;新增了一个命令行工具jcmd。它是一个多功能的工具&#xff0c;可以用来实现前面除了jstat之外所有命令的功能…...

c++信号和槽机制的轻量级实现,sigslot 库介绍及使用

Qt中的信号与槽机制很好用&#xff0c;然而只在Qt环境中。在现代 C 编程中&#xff0c;对象间的通信是一个核心问题。为了解决这个问题&#xff0c;许多库提供了信号和槽&#xff08;Signals and Slots&#xff09;机制。今天推荐分享一个轻量级的实现&#xff1a;sigslot 库。…...

云原生项目纪事系列 - 项目管理的鲜活事例

大规模云原生系统的新颖性、建设性和挑战性&#xff0c;吸引着许多有数学思想、哲学意识和美学观念的系统架构师&#xff0c;老模也是其中一员。 老模即是文史家庭出身&#xff0c;又有理工学业背景&#xff0c;他基于平时记录的翔实细节&#xff0c;秉持客观原则&#xff0c;使…...

【Vite】快速入门及其配置

概述 Vite是前端构建工具。vite 相较于webpack,vite采用了不同的运行方式&#xff1a; 开发时&#xff0c;并不对代码打包&#xff0c;而是直接采用ESM的方式来运行项目在项目打包部署时&#xff0c;使用 rollup 对项目进行打包除了速度外&#xff0c;vite使用起来也更加方便…...

Armv8/Armv9架构的学习大纲-学习方法-自学路线-付费学习路线

本文给大家列出了Arm架构的学习大纲、学习方法、自学路线、付费学习路线。有兴趣的可以关注&#xff0c;希望对您有帮助。 如果大家有需要的&#xff0c;欢迎关注我的CSDN课程&#xff1a;https://edu.csdn.net/lecturer/6964 ARM 64位架构介绍 ARM 64位架构介绍 ARM架构概况…...

vue 中 ui 组件二次封装后 ref 怎么穿透到子组件里

情景&#xff1a;element-ui 二次封装了 el-table 组件&#xff0c;使用封装组件时&#xff0c;想要调用 el-table 组件内置的一些方法。只在封装组件上定义 ref 是拿不到 el-table 内置方法的。解决方法如下。 1. vue2 封装组件 <template><el-table ref"inn…...

sourcetree中常用功能使用方法及gitlab冲突解决

添加至缓存&#xff1a;等于git add 提交&#xff1a;等于git commit 拉取/获取&#xff1a;等于git pull ,在每次要新增代码或者提交代码前需要先拉取一遍服务器中最新的代码&#xff0c;防止服务器有其他人更新了代码&#xff0c;但我们自己本地的代码在我们更新前跟服务器不…...

SQL Server分布式查询:跨数据库的无缝数据探索

SQL Server分布式查询&#xff1a;跨数据库的无缝数据探索 在当今的企业环境中&#xff0c;数据往往分散在不同的数据库和服务器上。SQL Server的分布式查询功能提供了一种强大的手段&#xff0c;允许用户编写单一的查询来访问和操作分散在不同SQL Server实例中的数据。本文将…...

【字少图多剖析微服务】深入理解Eureka核心原理

深入理解Eureka核心原理 Eureka整体设计Eureka服务端启动Eureka三级缓存Eureka客户端启动 Eureka整体设计 Eureka是一个经典的注册中心&#xff0c;通过http接收客户端的服务发现和服务注册请求&#xff0c;使用内存注册表保存客户端注册上来的实例信息。 Eureka服务端接收的…...

如何在 Linux 中解压 ZIP 文件

ZIP 是一种常用的压缩文件格式&#xff0c;用于存储和传输多个文件。在 Linux 系统中&#xff0c;解压 ZIP 文件非常简单。 使用 unzip 命令 unzip 是一个专用于解压 ZIP 文件的命令行工具。要使用它&#xff0c;请打开终端并输入以下命令&#xff1a; 例如&#xff0c;要解…...

IDEA的APIPost接口测试插件详解

APIPOST官方网址 一、安装APIPost插件 打开IntelliJ IDEA&#xff1a; 启动您的IntelliJ IDEA开发环境。 导航到插件设置&#xff1a; 在Windows或Linux上&#xff0c;点击 File > Settings。在macOS上&#xff0c;点击 IntelliJ IDEA > Preferences。 搜索并安装APIPo…...

[经验] 驰这个汉字的拼音是什么 #学习方法#其他#媒体

驰这个汉字的拼音是什么 驰&#xff0c;是一个常见的汉字&#xff0c;其拼音为“ch”&#xff0c;音调为第四声。它既可以表示动词&#xff0c;也可以表示形容词或副词&#xff0c;意义广泛&#xff0c;经常出现在生活和工作中。下面就让我们一起来了解一下“驰”的含义和用法。…...

生成式人工智能落地校园与课堂的15个场景

生成式人工智能正在重塑教育行业&#xff0c;为传统教学模式带来了革命性的变化。随着AI的不断演进&#xff0c;更多令人兴奋的应用场景将逐一显现&#xff0c;为学生提供更加丰富和多元的学习体验。 尽管AI在教学中的应用越来越广泛&#xff0c;但教师们也不必担心会被完全替代…...

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录 第一章 概述 第二章 弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制 第三章 主要定义 …...

EtherNet/IP转DeviceNet协议网关详解

一&#xff0c;设备主要功能 疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络&#xff0c;本网关连接到EtherNet/IP总线中做为从站使用&#xff0c;连接到DeviceNet总线中做为从站使用。 在自动…...

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现&#xff08;两者等价&#xff09;&#xff0c;用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例&#xff1a; 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

如何理解 IP 数据报中的 TTL?

目录 前言理解 前言 面试灵魂一问&#xff1a;说说对 IP 数据报中 TTL 的理解&#xff1f;我们都知道&#xff0c;IP 数据报由首部和数据两部分组成&#xff0c;首部又分为两部分&#xff1a;固定部分和可变部分&#xff0c;共占 20 字节&#xff0c;而即将讨论的 TTL 就位于首…...

有限自动机到正规文法转换器v1.0

1 项目简介 这是一个功能强大的有限自动机&#xff08;Finite Automaton, FA&#xff09;到正规文法&#xff08;Regular Grammar&#xff09;转换器&#xff0c;它配备了一个直观且完整的图形用户界面&#xff0c;使用户能够轻松地进行操作和观察。该程序基于编译原理中的经典…...

MySQL账号权限管理指南:安全创建账户与精细授权技巧

在MySQL数据库管理中&#xff0c;合理创建用户账号并分配精确权限是保障数据安全的核心环节。直接使用root账号进行所有操作不仅危险且难以审计操作行为。今天我们来全面解析MySQL账号创建与权限分配的专业方法。 一、为何需要创建独立账号&#xff1f; 最小权限原则&#xf…...

mac 安装homebrew (nvm 及git)

mac 安装nvm 及git 万恶之源 mac 安装这些东西离不开Xcode。及homebrew 一、先说安装git步骤 通用&#xff1a; 方法一&#xff1a;使用 Homebrew 安装 Git&#xff08;推荐&#xff09; 步骤如下&#xff1a;打开终端&#xff08;Terminal.app&#xff09; 1.安装 Homebrew…...

C# 表达式和运算符(求值顺序)

求值顺序 表达式可以由许多嵌套的子表达式构成。子表达式的求值顺序可以使表达式的最终值发生 变化。 例如&#xff0c;已知表达式3*52&#xff0c;依照子表达式的求值顺序&#xff0c;有两种可能的结果&#xff0c;如图9-3所示。 如果乘法先执行&#xff0c;结果是17。如果5…...

Chromium 136 编译指南 Windows篇:depot_tools 配置与源码获取(二)

引言 工欲善其事&#xff0c;必先利其器。在完成了 Visual Studio 2022 和 Windows SDK 的安装后&#xff0c;我们即将接触到 Chromium 开发生态中最核心的工具——depot_tools。这个由 Google 精心打造的工具集&#xff0c;就像是连接开发者与 Chromium 庞大代码库的智能桥梁…...

ubuntu22.04 安装docker 和docker-compose

首先你要确保没有docker环境或者使用命令删掉docker sudo apt-get remove docker docker-engine docker.io containerd runc安装docker 更新软件环境 sudo apt update sudo apt upgrade下载docker依赖和GPG 密钥 # 依赖 apt-get install ca-certificates curl gnupg lsb-rel…...