【MySQL 保姆级教学】事务的隔离级别(详细)--下(13)
事务的隔离级别
- 1. 如何理解事务的隔离性
- 2. 事务隔离级别的分类
- 3. 查看和设置事务隔离级别
- 3.1 全局和会话隔离级别
- 3.2 查看和设置隔离级别
- 4. 事务隔离级别的演示
- 4.1 读未提交(Read Uncommitted)
- 4.2 读已提交(Read Committed)
- 4.3 可重复读(Repeatable Read)
- 4.3.1 为什么要有可重复读?
- 4.3.2 可重复读
- 4.3.3 说明
- 4.4 序列化(Serializable)
- 5. 总结
1. 如何理解事务的隔离性
MySQL服务可能会同时被多个客户端进程(线程)访问,访问的方式以事务方式进行。
一个事务可能由多条SQL构成,也就意味着,任何一个事务,都有执行前,执行中,执行后的阶段。而所谓的原子性,其实就是让用户层,要么看到执行前,要么看到执行后。执行中出现问题,可以随时回滚。所以单个事务,对用户表现出来的特性,就是原子性。
但,毕竟所有事务都要有个执行过程,那么在多个事务各自执行多个SQL的时候,就还是有可能会出现互相影响的情况。比如:多个事务同时访问同一张表,甚至同一行数据。
比如,给同学1的任务是一次性把水池装满,给同学2的任务是一次性把水池的水放干:同学1在装水池的过程中而同学2放水池的水,结果他们俩个相互影响都完成不了任务。如果他们两个的工作隔离起来,先让同学1装水,水装满后同学2在进行放水,这样他们两个都可以完成任务。
数据库中,为了保证事务执行过程中尽量不受干扰,就有了一个重要特征:隔离性
数据库中,允许事务受不同程度的干扰,就有了一种重要特征:隔离级别
2. 事务隔离级别的分类
-
读未提交(Read Uncommitted)
定义:在读未提交隔离级别下,一个事务可以读取另一个事务尚未提交的数据。这是最低的隔离级别,允许脏读(Dirty Reads)。- 优点:提供最高的并发性能,因为事务之间几乎没有阻塞。
- 缺点:可能会出现脏读,即读取到其他事务未提交的数据。可能会出现不可重复读(Non-repeatable Reads)和幻读(Phantom Reads)。
-
读已提交(Read Committed)
定义:在读已提交隔离级别下,一个事务只能读取到另一个事务已经提交的数据。事务在每次读取数据时都会看到最新的已提交数据。- 优点:避免了脏读。提供了较好的并发性能。
- 缺点:可能会出现不可重复读,即在同一事务中多次读取同一数据时,可能会得到不同的结果。可能会出现幻读。
-
可重复读(Repeatable Read)
定义:在可重复读隔离级别下,一个事务在执行期间多次读取同一数据时,结果始终相同,即使其他事务对这些数据进行了修改并提交。这是 MySQL 的默认隔离级别。- 优点:避免了脏读和不可重复读。提供了较高的数据一致性。
- 缺点:可能会出现幻读,即在同一事务中多次执行相同的查询,可能会出现新的记录。
-
序列化(Serializable)
定义:在序列化隔离级别下,事务被完全隔离,每个事务都按顺序执行,如同在单线程环境中一样。这是最高的隔离级别,确保了数据的一致性,但并发性能较差。- 优点:避免了脏读、不可重复读和幻读。提供了最高的数据一致性。
- 缺点:并发性能较低,因为事务之间会有更多的阻塞和等待。
3. 查看和设置事务隔离级别
3.1 全局和会话隔离级别
-
全局隔离级别(Global Isolation Level)
- 全局隔离级别为所有新会话的默认隔离级别。
- 一旦设置,所有新的会话将使用这个隔离级别,除非在会话中明确更改。
- 对已经存在的会话没有影响。
-
会话隔离级别(Session Isolation Level)
- 会话隔离级别为当前会话的隔离级别。
- 默认的使用是全局隔离级别。
- 修改后仅对当前会话有效,不影响其他会话。
3.2 查看和设置隔离级别
全局隔离级别的设置:
SET GLOBAL TRANSACTION ISOLATION LEVEL isolation_level;
查询全局的隔离级别:
SELECT @@GLOBAL.TX_ISOLATION;
会话隔离级别的设置:
SET SESSION TRANSACTION ISOLATION LEVEL isolation_level;
查询会话的隔离级别:
SELECT @@SESSION.TX_ISOLATION;
SELECT @@TX_ISOLATION;
示例:
查询全局隔离级别和会话隔离级别:
# 查看全局隔离级别
select @@global.tx_isolation;# 查看会话
select @@session.tx_isolation;
显然,全局隔离级别和会话隔离级别是一样的,因为当开启一个新的客户端时,会话隔离级别默认是全局的隔离级别。
修改会话的隔离级别为 read uncommitted
读未提交,再次查询会话隔离级别
set session transaction isolation level read uncommitted;
显然,会话的隔离级别已经变为读未提交
。
修改全局的隔离级别为 read committed
读提交,然后查询全局和会话隔离级别
# 设置全局隔离级别
set global transaction isolation level read committed;# 查询隔离级别
select @@global.tx_isolation;
select @@session.tx_isolation;
为什么全局隔离级别后,全局隔离级别和会话隔离接不一样呢?
答:会话隔离级别默认的是上次修改的(创建会话时默认全局隔离级别),修改全局隔离级别不能直接修改当前会话的隔离级别。
退出MySQL,再次进入MySQL客户端,查看隔离级别
# 退出
quit# 查询隔离级别
select @@global.tx_isolation;
select @@session.tx_isolation;
这时两者的隔离级别全是读提交
。
4. 事务隔离级别的演示
4.1 读未提交(Read Uncommitted)
字面的意思来理解,当一个客户端在事务中操作时并未提交事务,另一个客户端能读到该客户端操作的数据。
定义:在读未提交隔离级别下,一个事务可以读取另一个事务尚未提交的数据。这是最低的隔离级别,允许脏读(Dirty Reads)。
优点:提供最高的并发性能,因为事务之间几乎没有阻塞。
缺点:可能会出现脏读,即读取到其他事务未提交的数据。可能会出现不可重复读(Non-repeatable Reads)和幻读(Phantom Reads)。
几乎没有加锁,虽然效率高,但是问题太多,严重不建议采用
举例:
创建两个会话。左侧为客户端1,右侧为客户端2。
设置读未提交
隔离级别:
set session transaction isolation level read uncommitted;
在客户端1插入数据,客户端2查询数据。
# 客户端1insert into students values(1, '李明', 18);# 创建保存点savepoint p1;# 客户端2select * from students;
显然,在客户端1执行命令后未使用commit提交,在客户端2就可以直接查询出操作结果。
一个事务在执行中,读到另一个执行中事务的更新(或其他操作)但是未commit的数据,这种现象叫做脏读(dirty read)
在客户端1模拟崩溃;然后在客户端2查询数据
# 客户端1`CRRL + D`# 客户端2select * from students;
很容易看出,当客户端1没有提交时系统崩溃后就会回滚到事务的开始,事务中所有的操作都会被撤销。
4.2 读已提交(Read Committed)
字面的意思来理解,当一个客户端在事务中操作时并提交事务后,另一个客户端才能读到该客户端操作的数据。
定义:在读已提交隔离级别下,一个事务只能读取到另一个事务已经提交的数据。事务在每次读取数据时都会看到最新的已提交数据。
优点:避免了脏读。提供了较好的并发性能。
缺点:可能会出现不可重复读,即在同一事务中多次读取同一数据时,可能会得到不同的结果。可能会出现幻读。
举例:
创建两个会话。左侧为客户端1,右侧为客户端2。
设置读已提交
隔离级别:
set session transaction isolation level read committed;
在客户端1插入数据,客户端2查询数据。
# 客户端1insert into students values(1, '李明', 18);# 客户端2select * from students;
可以发现,客户端1插入数据后在客户端2并不能查询到插入的数据。
这是为什么呢?
答:读已提交隔离级别,一个事务只能读取到另一个事务已经提交的数据,在事务未提交之前其他的客户端时不能读取到的。
在客户端1插入数据并提交,客户端2查询数据。
# 客户端1insert into students values(2, '诸葛亮', 20);commit;# 客户端2select * from students;
显然,当客户端1提交事务后客户端2就能读到数据了。
4.3 可重复读(Repeatable Read)
4.3.1 为什么要有可重复读?
读已提交
不是已经够完美了吗,为什么还要有可重复读
呢?
答:读已提交
只是看上去很方便,但是在实际的工作中会有很大的问题,主要的问题就在于在事务中能读到其他已经提交的事务。
比如,学校要给考试成绩好的学生发奖品,工作人员在筛选成绩的同时,另一工作人员发现第9名同学的成绩多算分了,正在减分。如图:
通过上图可知,小明的名字筛选出两次,那么生成的表中会有两个成绩不一样的名字。这肯定是不合适的。
4.3.2 可重复读
定义:在可重复读隔离级别下,一个事务在执行期间多次读取同一数据时,结果始终相同,即使其他事务对这些数据进行了修改并提交。这是 MySQL 的默认隔离级别。
优点:避免了脏读和不可重复读。提供了较高的数据一致性。
缺点:可能会出现幻读,即在同一事务中多次执行相同的查询,可能会出现新的记录。
举例:
创建两个会话。左侧为客户端1,右侧为客户端2。
设置可重复读
隔离级别:
set session transaction isolation level repeatable read;
在客户端1插入数据,客户端2查询数据。
# 客户端1insert into students values(3, '李白', 20);# 客户端2select * from students;
可以发现,客户端1插入数据后在客户端2并不能查询到插入的数据。
在客户端1插入数据后提交事务,客户端2查询数据。
# 客户端1insert into students values(4, '嫦娥, 18);commit;# 客户端2select * from students;
客户端1把事务提交后客户端2为什么还是不能查询到数据呢?
答:在可重复读隔离级别下,一个事务在执行期间多次读取同一数据时,结果始终相同,即使其他事务对这些数据进行了修改并提交。只用把自己的事务提交后,才能查询到其他已提交事务更改后的数据。
提交客户端2的事务后再进行查询
# 客户端2
#提交事务
commit;# 查询
select * from students;
显然,当客户端2提交事务后就可以查询到客户端已插入的数据。
4.3.3 说明
多次查看,发现终端A在对应事务中insert
的数据,在终端B的事务周期中,也没有什么影响,也符合可重复的特点。
但是,一般的数据库在可重复读情况的时候,无法屏蔽其他事务insert
的数据。
为什么?因为隔离性实现是对数据加锁完成的,而insert
待插入的数据因为并不存在,那么一般加锁无法屏蔽这类问题,会造成虽然大部分内容是可重复读的,但是insert的数据在可重复读情况被读取出来,导致多次查找时,会多查找出来新的记录,就如同产生了幻觉。
这种现象,叫做幻读(phantom read)。很明显,MySQL在RR级别的时候,是解决了幻读问题的
(解决的方式是用Next-Key锁(GAP+行锁)解决的。这块比较难,有兴趣同学了解一下)。
4.4 序列化(Serializable)
序列化也叫做串行化。
定义:在序列化隔离级别下,事务被完全隔离,每个事务都按顺序执行,如同在单线程环境中一样。这是最高的隔离级别,确保了数据的一致性,但并发性能较差。
优点:避免了脏读、不可重复读和幻读。提供了最高的数据一致性。
缺点:并发性能较低,因为事务之间会有更多的阻塞和等待。
举例:
创建两个会话。左侧为客户端1,右侧为客户端2。
-
场景1:两个客户端都查询数据,客户端2提交事务,然后客户端1提交事务。
设置序列化隔离级别,开启事务set session transaction isolation level serializable;
客户端1和客户端2都对表进行查询(此时两个事务都对表进行了加锁)
# 客户端1 select * from students;# 客户端2 select * from students;
客户端1进行插入表操作时发生
锁等待
客户端1输入插入命令按回车键后,光标在命令的下面,说明该命令正在等待执行,这是为什么呢?答:在
序列化
隔离级别下,产生锁是为了确保数据的一致性;事务中的命令只要对表进行查询,就会锁住表,但是其他事务中的命令对此表也可以进行锁住;表只有被一个事务锁住时才能进行修改操作。此时的表被两个事务锁住了,客户端1想进行修改操作只有先让客户端2把事务提交(解开对表的锁)。
客户端2对表解锁:
# 客户端2 commit;
-
场景2:两个客户端都查询数据,然后都插入数据
设置序列化隔离级别,开启事务set session transaction isolation level serializable;
客户端1和客户端2都对表进行查询(此时两个事务都对表进行了加锁)
# 客户端1 select * from students;# 客户端2 select * from students;
客户端1对表进行插入,客户端2对表进行插入
# 客户端1 insert into students values(6,'6',6);# 客户端2 insert into students values(7,'7',7);
当客户端2对表进行插入的时候发生死锁,什么是死锁呢?
答:两个事务试图同时访问同一个资源(比如插入同一条记录,就会发生死锁。MySQL会检测到这种情况,并返回错误信息,提示用户重启其中一个事务。当客户端2发生死锁的时候就会被强制重启事务,此时读表的锁就只有客户端2了,客户端1对表的操作就可以进行了。
-
场景3:两个客户端都查询数据,客户端1插入数据(等待插入数据)
设置序列化隔离级别,开启事务set session transaction isolation level serializable;
客户端1和客户端2都对表进行查询(此时两个事务都对表进行了加锁)
# 客户端1 select * from students;# 客户端2 select * from students;
客户端1对表进行插入,客户端2不进行任何操作
# 客户端1 insert into students values(6,'6',6);# 客户端2
执行步骤3后不在进行任何的操作,过几分钟后步骤4会自动弹出,修改表的操作尝试获取锁时超过了等待时间限制,导致事务无法继续执行。
5. 总结
- 其中隔离级别越严格,安全性越高,但数据库的并发性能也就越低,往往需要在两者之间找一个平
衡点。 - 不可重复读的重点是修改和删除:同样的条件, 你读取过的数据,再次读取出来发现值不一样了
- 幻读的重点在于新增:同样的条件, 第1次和第2次读出来的记录数不一样
- 说明:mysql 默认的隔离级别是可重复读,一般情况下不要修改
- 上面的例子可以看出,事务也有长短事务这样的概念。事务间互相影响,指的是事务在并行执行的时候,即都没有commit的时候,影响会比较大。
隔离级别 | 脏读 | 不可重复读 | 幻读 | 加锁读 |
---|---|---|---|---|
读未提交(read uncommit) | YES | YES | YES | NO |
读已提交(read commit) | NO | YES | YES | NO |
可重复读(repeatable) | NO | NO | NO | NO |
序列化(可串行化)(serializable) | NO | NO | NO | YES |
一致性(Consistency) :
- 事务执行的结果,必须使数据库从一个一致性状态,变到另一个一致性状态。当数据库只包含事务
成功提交的结果时,数据库处于一致性状态。如果系统运行发生中断,某个事务尚未完成而被迫中
断,而改未完成的事务对数据库所做的修改已被写入数据库,此时数据库就处于一种不正确(不一
致)的状态。因此一致性是通过原子性来保证的。 - 其实一致性和用户的业务逻辑强相关,一般MySQL提供技术支持,但是一致性还是要用户业务逻辑
做支撑,也就是,一致性,是由用户决定的。 - 而技术上,通过AID保证C
推荐阅读 :
如何实现事务的隔离性
Innodb中的事务隔离级别和锁的关系
MySQL间隙锁原理
相关文章:

【MySQL 保姆级教学】事务的隔离级别(详细)--下(13)
事务的隔离级别 1. 如何理解事务的隔离性2. 事务隔离级别的分类3. 查看和设置事务隔离级别3.1 全局和会话隔离级别3.2 查看和设置隔离级别 4. 事务隔离级别的演示4.1 读未提交(Read Uncommitted)4.2 读已提交(Read Committed)4.3 …...

SpringBoot(十三)SpringBoot配置webSocket
在PHP版本的博客中,我使用PHPswoole实现了webscoket即时聊天的功能。 在java版本的博客中,我也想使用webscoket来实现即时聊天的功能,下边是我实现过程的一个记录。 一:在pom.xml中添加记录 <!-- spring-websocket start --&…...

OA系统都有哪些功能?OA办公系统功能大测评
随着现代企业对效率和协作的需求不断增加,OA办公系统已成为许多企业日常运营的重要工具。 一个功能完备的OA系统不仅能帮助企业提高办公效率,还能优化各类工作流程,从文档管理到审批流程、任务管理等,它为企业提供了全方位的支持…...

优化布线拥塞
Note:文章内容以 Xilinx 系列 FPGA 进行讲解 随着设计规模的增大和复杂度的提升,布线拥塞成为常见的问题,尤其是在用UltraScale FPGA或UltraScale FPGA时,布线拥塞往往成为时序收敛的瓶颈,也成为编译时间过长的“罪魁…...

盲盒APP开发,电商模式下盲盒的未知乐趣
在互联网电商模式逐渐成熟的当下,盲盒电商为消费者提供了一个全新的娱乐购物体验,让众多粉丝和消费者通过手机系统就可以体验拆盲盒的惊喜感和刺激性。在消费者享受线上拆盲盒的乐趣时,企业也能够获得新的发展机遇,扩大发展空间。…...

RocketMQ-02 集群架构部署
根据上一章《RocketMQ消费模型和部署模型》得知,启动rocketmq非常简单,只需要分别执行mqnamesrv启动NameServer,执行mqbroker启动Broker即可。但生产环境不可能仅使用单节点MQ,为提高可用性和吞吐量,生产常使用集群模式…...

处理报文后 展示在qtdesigner界面 ,有大量数据存储 怎样创建临时文件减少内存占用
处理大量数据并将其展示在 Qt Designer 创建的界面中时,确实可能会遇到内存占用过高的问题。使用临时文件来存储和管理数据是一种有效的解决方案,可以帮助减少内存占用。 import os import shutil import tempfile from PyQt5.QtWidgets import QApplica…...

后端-实现excel的导出功能(超详细讲解)
首先,不管是一大段文字还是一个几行几列的表格实现方式都是一样的。把动态的内容使用英文单词代替。动态的内容加不加下划线都可以,加了下划线最后生成的表格动态内容部分带有下划线,不加下划线最后生成的表格动态内容部分不带下划线。大家各…...

Docker compose部署portainer
整个工具的代码都在Gitee或者Github地址内 gitee:solomon-parent: 这个项目主要是总结了工作上遇到的问题以及学习一些框架用于整合例如:rabbitMq、reids、Mqtt、S3协议的文件服务器、mongodb github:GitHub - ZeroNing/solomon-parent: 这个项目主要是…...

【游戏引擎之路】登神长阶(十四)——OpenGL教程:士别三日,当刮目相看
【游戏引擎之路】登神长阶(十四)——OpenGL教程:士别三日,当刮目相看 2024年 5月20日-6月4日:攻克2D物理引擎。 2024年 6月4日-6月13日:攻克《3D数学基础》。 2024年 6月13日-6月20日:攻克《3D…...

相等日期问题(c++方法解决)
问题描述 对于一个日期,我们可以计算出年份的各个数位上的数字之和,也可以分别计算月和日的各位数字之和。请问从 1900 年 1 月 1 日至 9999 年 12 月 31 日,总共有多少天,年份的数位数字之和等于月的数位数字之和加日的数位数字之…...

深度学习——优化算法、激活函数、归一化、正则化
文章目录 🌺深度学习面试八股汇总🌺优化算法方法梯度下降 (Gradient Descent, GD)动量法 (Momentum)AdaGrad (Adaptive Gradient Algorithm)RMSProp (Root Mean Square Propagation)Adam (Adaptive Moment Estimation)AdamW 优化算法总结 经验和实践建议…...

Android 老项目适配 Compose 混合开发
在Android项目中使用Jetpack Compose进行混合开发时,可以通过以下步骤进行适配: 1.更新项目的build.gradle文件,确保使用最新的Compose库版本。 dependencies { implementation androidx.compose.ui:ui:<latest_version> implementat…...

PH热榜 | 2024-11-14
DevNow 是一个精简的开源技术博客项目模版,支持 Vercel 一键部署,支持评论、搜索等功能,欢迎大家体验。 [在线预览](https://www.laughingzhu.c 1. Vocera 标语:利用模拟和监控加速语音代理上线 这句话的意思是:通过…...

删库跑路,启动!
起因:这是一个悲伤的故事,在抓logcat时 device待机自动回根目录了,而题主对当前路径的印象还停留在文件夹下,不小心在根目录执行了rm -rf * … 所以,这是个悲伤的故事,东西全没了…device也黑屏了ÿ…...

Vue 3 在现代前端开发中的应用
💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 Vue 3 在现代前端开发中的应用 Vue 3 在现代前端开发中的应用 Vue 3 在现代前端开发中的应用 引言 Vue 3 概述 定义与原理 发展历…...

【HarmonyOS】Hdc server port XXXX has been used.Configure environment variable
【HarmonyOS】Hdc server port XXXX has been used.Configure environment variable 一、 问题背景: 无法调试debug应用,IDE右下角显示该弹窗: Hdc server port XXXX has been used.Configure environment variable ‘OHOS_HDC_SERVER_POR…...

使用 ts-node 运行 ts文件,启动 nodejs项目
最近在写一个nodejs项目,使用 ts-node 启动项目。遇到了一些问题,在此记录一下。 ts-node 是 TypeScript 执行引擎和 Node.js 的 REPL(一个简单的交互式的编程环境)。 它能够直接在 Node.js 上执行 TypeScript,而无需预编译。 这是通过挂接…...

scala中的case class
package test_27 //Set的特点:唯一(元素不同);无序 //case class定义一组数据 case class Book(var bookName:String,var author:String,var price:Double){} object caseclass {def main(args: Array[String]): Unit {//定义一个…...

探索 HTTP 请求方法:GET、POST、PUT、DELETE 等的用法详解
文章目录 前言一、GET 方法:用于获取资源二、POST 方法:用于提交数据三、PUT 方法:用于更新资源四、DELETE 方法:用于删除资源五、PATCH 方法:用于部分更新资源六、HEAD 方法:用于请求响应头七、OPTIONS 方…...

前端项目中,public文件下的system.js有什么作用
SystemJS在前端项目中的作用主要包括模块加载、资源管理和兼容性处理。 模块加载 SystemJS是一个通用的模块加载器,支持多种模块规范,包括CommonJS、AMD、全局模块对象和ES6模块。通过使用插件,它还可以加载CoffeeScript和TypeScript。…...

odoo-040 odoo17前端的js方法调用后端py方法action报错
文章目录 问题描述梳理写法xml写法前端方法后端action的写法 错误解释 问题描述 在前端的kanban视图上添加了几个自定义按钮,按钮点击可以跳转到对应的tree视图,在写按钮调用方法的时候报错如下: 前端调用后端action报错: actio…...

图形 2.7 LDR与HDR
LDR与HDR B站视频:图形 2.7 LDR与HDR 文章目录 LDR与HDR基本概念LDRHDR为什么需要HDR不同显示屏的差异 Unity中的HDRCamera HDR 设置Lightmap HDR设置拾色器 HDR设置优缺点 HDR与Bloom通常Bloom渲染步骤渲染出原图获取图像中较亮部分高斯模糊叠加 Unity中Bloom渲染…...

DP动态规划基础题(Kadane算法)
动态规划(Dynamic Programming,简称DP)是一种在数学、管理科学、计算机科学、经济学和生物信息学等领域中使用的,通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。动态规划算法通常用于优化问题,特别是那…...

[UnLua]动态创建SceneCapture2d相机,并且添加渲染目标纹理
在 Unlua 开发中,相机相关的操作是构建场景视觉效果的重要部分。以下我们来详细分析一段涉及相机实例化和为相机赋予纹理目标的 Unlua 代码。 -- 实例化相机local World self:GetWorld()maskCamera World:SpawnActor(UE.ASceneCapture2D)-- 给相机赋值纹理目标lo…...

【leetcode练习·二叉树】用「分解问题」思维解题 I
本文参考labuladong算法笔记[【强化练习】用「分解问题」思维解题 I | labuladong 的算法笔记] 105. 从前序与中序遍历序列构造二叉树 | 力扣 | LeetCode | 给定两个整数数组 preorder 和 inorder ,其中 preorder 是二叉树的先序遍历, inorder 是同一棵…...

【gitlab-ce】各组件介绍
主要组件功能接介绍(chatgpt回答的) nginx:作为Web服务器和反向代理,用于访问GitLab的Web界面。可以关闭,但会导致无法通过Web界面访问GitLab。prometheus_monitoring:提供监控和报警功能,收集和…...

PostgreSQL分区表:基础语法与运维实践
引言 简介:什么是数据库分区 数据库分区是一种将大型表物理上分割成多个较小的部分的技术。每个部分称为一个分区,这些分区可以分布在不同的存储设备上,以提高查询性能和管理效率。 为什么使用分区表 提高查询性能:通过减少需…...

Docker入门系列——DockerFile的使用
前面了解了Docker的基本概念,今天来认识一下DockerFile。 Dockerfile 是一个文本文件,包含一系列指令来组装 Docker 镜像。每个指令执行一个特定动作,例如安装包、复制文件或定义启动命令。正确使用 Dockerfile 指令对于构建高效容器至关重要…...

数据集平台分享
Kaggle: Your Machine Learning and Data Science CommunityKaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.https://www.kaggle.com/Kaggle 包含非常丰富的数据集和代码,…...