当前位置: 首页 > news >正文

超详细解读!数据库表分区技术全攻略

更多内容可以关注微信公众号:老程序员刘飞

分区的定义

分区是一种数据库优化技术,它可以将大表按照一定的规则分成多个小表,从而提高查询和维护的效率。在分区的过程中,数据库会将数据按照分区规则分配到不同的分区中,并且可以在分区中使用索引和其他优化技术来提高查询效率。

在 MySQL 数据库中,我们可以使用分区表来实现分区。分区表是指将一个大表拆分成多个小表,每个小表称为一个分区,分区表中包含多个分区,每个分区对应一个独立的物理存储空间。

举例说明

下面是一个在 MySQL 中创建分区表的例子:
image.png

在上面的例子中,我们创建了一个名为“sales”的分区表,该表包含五个分区,每个分区分别对应一个年份,数据将根据年份进行分区。例如,分区 p0 存储 2010 年之前的销售记录,分区 p1 存储 2011 年的销售记录,以此类推。

使用分区表可以在查询大量数据时提高查询效率。在查询时,数据库会根据查询条件在对应的分区中进行查询,从而减少不必要的扫描。此外,由于数据被分散到不同的分区中,可以提高数据的并行处理能力,从而进一步提高查询效率。

分区的作用

在数据库中,分区是通过数据划分、管理和查询优化等多种技术实现的。下面是分区的底层逻辑:

  1. 数据划分:分区的第一步是将数据按照某种规则进行划分,将大表划分为多个小表。在 MySQL 中,可以通过 RANGE、LIST、HASH、KEY 等方式进行分区,其中 RANGE 分区是最常用的一种。RANGE 分区是将表按照某个列的值范围进行划分,每个分区包含一个范围内的值。例如,可以将时间列作为 RANGE 分区键,将数据按照年、月、日等时间段进行划分。
  2. 分区管理:分区表的管理包括分区的创建、修改、删除等操作。在 MySQL 中,可以通过 ALTER TABLE 语句来对分区表进行管理。例如,可以使用 ALTER TABLE ADD PARTITION 命令来添加新分区,使用 ALTER TABLE DROP PARTITION 命令来删除分区。
  3. 查询优化:在分区表中查询时,数据库会自动选择合适的分区进行查询,并在每个分区中使用索引等技术进行优化。在 MySQL 中,可以使用 EXPLAIN PARTITIONS SELECT 语句来查看查询计划,了解查询将在哪些分区中执行。在查询时,如果查询条件涉及到分区键列,则数据库可以根据条件确定查询的分区范围,从而减少不必要的扫描,提高查询效率。

分区的底层逻辑主要涉及数据划分、分区管理和查询优化等方面。通过分区,可以将大表划分为多个小表,从而提高查询和维护的效率,同时也可以提高数据库的并行处理能力

分区的方式

是的,MySQL 支持多种分区方式,包括 RANGE、LIST、HASH、KEY 等方式。下面是这些分区方式的具体介绍和操作方法:

  1. RANGE 分区:根据分区键的范围进行划分,每个分区包含一个范围内的值。例如,可以将时间列作为 RANGE 分区键,将数据按照年、月、日等时间段进行划分。创建 RANGE 分区表的方法如下:
    image.png

  2. LIST 分区:根据分区键的列表进行划分,每个分区包含一个列表内的值。例如,可以将国家列作为 LIST 分区键,将数据按照不同的国家进行划分。创建 LIST 分区表的方法如下:

image.png

  1. HASH 分区:根据分区键的哈希值进行划分,每个分区包含哈希值相同的记录。例如,可以将用户 ID 列作为 HASH 分区键,将数据按照用户 ID 进行划分。创建 HASH 分区表的方法如下:
    image.png

  2. KEY 分区:根据分区键的值的哈希值进行划分,与 HASH 分区类似,但只针对非唯一索引。例如,可以将用户姓名作为 KEY 分区键,将数据按照姓名的哈希值进行划分。创建 KEY 分区表的方法如下:

image.png

以上是分区表的创建方法示例,具体的分区键和分区数量可以根据实际情况进行调整。需要注意的是,分区表的使用需要根据实际情况进行优化和调整,以充分发挥分区的优势。

分区的扩展与修改

如果已经创建了分区表并且需要扩展分区,可以使用 ALTER TABLE 命令进行操作。下面是几个常见的扩展分区的操作:

  1. 增加新分区:可以通过 ALTER TABLE ADD PARTITION 命令增加新的分区。例如,假设已经有一个 RANGE 分区表,包含了 2010 年到 2020 年的数据,现在需要增加一个 2021 年的分区,可以执行如下命令:

image.png

  1. 合并分区:可以通过 ALTER TABLE COALESCE PARTITION 命令将相邻的分区合并成一个分区。例如,假设 RANGE 分区表中的 2019 年和 2020 年分区中的数据已经非常少了,可以将它们合并成一个分区,执行如下命令:

image.png

  1. 重新分区:可以通过 ALTER TABLE REORGANIZE PARTITION 命令重新划分分区,将数据重新分配到不同的分区中。例如,假设已经有一个 HASH 分区表,现在需要将分区数量增加到 8,可以执行如下命令:

image.png

在进行分区扩展操作时,需要注意一些细节问题,比如对于包含数据的分区不能直接删除,需要先将数据转移或删除。此外,在进行分区操作时需要谨慎,可以先在测试环境进行测试,以免出现不可预料的问题。

  1. 移动分区:可以通过 ALTER TABLE REORGANIZE PARTITION 命令移动分区中的数据到新的分区中。例如,假设已经有一个 RANGE 分区表,包含了 2010 年到 2020 年的数据,现在需要将 2020 年的数据移动到一个新的分区中,可以执行如下命令:

image.png

  1. 分离分区:可以通过 ALTER TABLE DROP PARTITION 命令分离某个分区,从而将分区从表中删除。例如,假设已经有一个 RANGE 分区表,包含了 2010 年到 2020 年的数据,现在需要将 2010 年的数据从表中删除,可以执行如下命令:

image.png

什么量级的表需要用到分区

一般来说,需要考虑使用分区的数量级别是千万级别甚至更高的数据量。具体来说,以下是一些考虑使用分区的场景:

  1. 数据量大:如果表中数据量很大,特别是超过了百万条,那么使用分区可以加快数据的查询和维护速度。
  2. 频繁的查询操作:如果表中的数据经常需要被查询和过滤,而且查询条件往往和某些列有关,那么使用分区可以将数据按照这些列进行分组,提高查询效率。
  3. 数据访问的分布式:如果表的数据需要在多个地方访问,例如分布式系统中的多个节点,那么使用分区可以减少数据传输的开销,提高访问速度。

需要注意的是,这些场景只是一般情况下使用分区的建议,具体是否需要使用分区还需要根据具体的情况来判断。如果数据量较小或者查询操作较少,使用分区反而会增加系统的复杂度,降低性能。

相关文章:

超详细解读!数据库表分区技术全攻略

更多内容可以关注微信公众号:老程序员刘飞 分区的定义 分区是一种数据库优化技术,它可以将大表按照一定的规则分成多个小表,从而提高查询和维护的效率。在分区的过程中,数据库会将数据按照分区规则分配到不同的分区中&#xff0…...

Redis高可用集群方案

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 @[TOC](文章目录)主从复制哨兵模式(sentinel)Cluster集群在生产过程中,Redis不一定会单独部署。因为一旦redis服务因为某些原因导致无法提供数,那么redis就不可用了。那么实现redis高可用的方式就…...

企业微信机器人发送消息

前言 随着科技的发展,各企业公司的业务不断发展,那么就需要强有力的沟通软件,其中企业微信、钉钉的能力得到了大众的认可,今天这篇文章就讲其中的一个功能-调用企业微信机器人(下文简称应用)进行消息传递。它的好处有哪些呢?自然是可以让相关人员及时追踪任务进度。 一、…...

使用PHP+yii2调用asmx服务接口

一.创建服务端 1:创建一个ASP.NET web应用程序 2:选择空的模板 3:系统生成项目目录 4:右键项目-添加项-新建项 5:选择Web 服务(ASMX) 6:选择之后项目中会有一个Test.asmx服务程序,…...

【042】904. 水果成篮[滑动窗口]

你正在探访一家农场,农场从左到右种植了一排果树。这些树用一个整数数组 fruits 表示,其中 fruits[i] 是第 i 棵树上的水果 种类 。 你想要尽可能多地收集水果。然而,农场的主人设定了一些严格的规矩,你必须按照要求采摘水果&…...

Linux基础知识(一)

♥️作者:小刘在C站 ♥️个人主页:小刘主页 ♥️每天分享云计算网络运维课堂笔记,努力不一定有收获,但一定会有收获加油!一起努力,共赴美好人生! ♥️夕阳下,是最美的绽放&#xff0…...

Redis面试题

目录 Redis持久化机制:RDB和AOF Redis线程模型有哪些?单线程为什么快? Redis的过期键有哪些删除策略? Redis集群方案有哪些? redis事务怎么实现? 为什么redis不支持回滚? redis主从复制的原理是什么 …...

微服务之Eureka

🏠个人主页:阿杰的博客 💪个人简介:大家好,我是阿杰,一个正在努力让自己变得更好的男人👨 目前状况🎉:24届毕业生,奋斗在找实习的路上🌟 &#x1…...

日日顺于贞超:供应链数字化要做到有数、有路、有人

在供应链行业里面,关于“数字化”的讨论绝对是一个经久不衰的话题。 但关于这个话题的讨论又时常让人觉得“隔靴搔痒”,因为数字化变革为非一日之功,对于企业来说意味着投入和牺牲。企业既怕不做怕将来被淘汰,又怕投入过高、不达预…...

Js中blob、file、FormData、DataView、TypedArray

引言 最开始我们看网页时,对网页的需求不高,显示点文字,显示点图片就很满足了,所以对于浏览器而言其操作的数据其实并不多(比如读取本地图片显示出来,或上传图片到服务器),那么浏览器…...

CTFer成长之路之任意文件读取漏洞

任意文件读取漏洞CTF 任意文件读取漏洞 afr_1 题目描述: 暂无 docker-compose.yml version: 3.2services:web:image: registry.cn-hangzhou.aliyuncs.com/n1book/web-file-read-1:latestports:- 80:80启动方式 docker-compose up -d 题目Flag n1book{afr_1_solved} W…...

制造企业为何要上数字化工厂系统?

以目前形势来看,数字化转型是制造企业生存的关键,而数字化工厂管理系统是一个综合性、系统性的工程,波及整个企业及其供应链生态系统。数字化工厂系统所要实现的互联互通系统集成、数据信息融合和产品全生命周期集成,将方方面面的…...

Facebook广告投放的正确姿势:玩转目标定位

如果你正在投放 Facebook广告,那么你一定有过这样的经历:明明设置了目标受众,但是广告却没有带来转化。在这方面,你可能忽略了一个很重要的因素——目标定位。想要打造高质量、高曝光率的 Facebook广告,如何才能成功实…...

思科C9115AXI-H型号AP上线C9800失败处理记录

问题描述 原先的AP故障,从DNAC上发现状态down。现场发现AP灯灭,端口不亮。随即定位为AP单点故障。暂时的处理方法为:更换新AP上线。更换完毕后发现绿灯亮后熄灭。进一步说明网线无异常,属于AP故障。 如果顺利,在DNAC上…...

WSO2通过设定Role来订阅对应的Api

WSO2通过设定Role来订阅对应的Api1. Add Role And User1.0 Add Role1.1 Add User 1.2 Add Mapping2. Upload Api2.1 Upload Three Apis2.2 Inspection3. AwakeningWSO2安装使用的全过程详解: https://blog.csdn.net/weixin_43916074/article/details/127987099. 1. Add Role An…...

使用 PyTorch+LSTM 进行单变量时间序列预测(附完整源码)

时间序列是指在一段时间内发生的任何可量化的度量或事件。尽管这听起来微不足道,但几乎任何东西都可以被认为是时间序列。一个月里你每小时的平均心率,一年里一只股票的日收盘价,一年里某个城市每周发生的交通事故数。 在任何一段时间段内记…...

操作系统(day12)-- 虚拟内存;页面分配策略

虚拟内存管理 虚拟内存的基本概念 传统存储管理方式的特征、缺点 一次性: 作业必须一次性全部装入内存后才能开始运行。驻留性:作业一旦被装入内存,就会一直驻留在内存中,直至作业运行结束。事实上,在一个时间段内&…...

Git commit 提交没有被远端分支合并,撤销本次commit

问题:今天修改代码,误把项目配置文件修改为本地数据库连接,需要撤销本次commit 记录。解决办法:第一步:使用git log 查看所有commit 记录。第二步:使用git show commitID 查看指定commit 文件修改记录。第三…...

Netty核心原理(线程模型、核心API)与入门案例详解

Netty核心原理(线程模型、核心API)与入门案例详解 文章目录Netty核心原理(线程模型、核心API)与入门案例详解Netty 介绍原生 NIO 存在的问题概述线程模型线程模型基本介绍传统阻塞 I/O 服务模型Reactor 模型单 Reactor 单线程Nett…...

【 java 8】Lambda 表达式

📋 个人简介 💖 作者简介:大家好,我是阿牛,全栈领域优质创作者。😜📝 个人主页:馆主阿牛🔥🎉 支持我:点赞👍收藏⭐️留言&#x1f4d…...

改进YOLO系列 | 谷歌团队 | CondConv:用于高效推理的条件参数化卷积

CondConv:用于高效推理的条件参数化卷积 论文地址:https://arxiv.org/pdf/1904.04971.pdf 代码地址:https://github.com/tensorflow/tpu/tree/master/models/official/efficientnet/condconv 卷积层是现代深度神经网络的基本构建模块之一。其中一个基本假设是,卷积核应该对数…...

SQL高级 --优化

一、SQL查询的解析 关联查询过多索引失效(单值、符合) 二、mysql explain使用简介 1、关于id的说明: 2 、select_type 常见和常用的值有如下几种: 分别用来表示查询的类型,主要是用于区别普通查询、联合查询、子…...

【C++】空间配置器

空间配置器,听起来高大上,那它到底是什么东西呢? 1.什么是空间配置器? 空间配置器是STL源码中实现的一个小灶,用来应对STL容器频繁申请小块内存空间的问题。他算是一个小型的内存池,以提升STL容器在空间申…...

nginx的介绍及源码安装

文章目录前言一、nginx介绍二、nginx应用场合三、nginx的源码安装过程1.下载源码包2.安装依赖性-安装nginx-创建软连接-启动服务-关闭服务3.创建nginx服务启动脚本4.本实验---纯代码过程前言 高可用:高可用(High availability,缩写为 HA),是指系统无中断地执行其功…...

通过openssl生成pfx证书

通过centos7上自带的openssl工具来生成。首先创建一个pfxcert目录。然后进入此目录。 1.生成.key文件(内含被加密后的私钥),要求输入一个自定义的密码 [rootlocalhost cert]# openssl genrsa -des3 -out server.key 2048 Generating RSA priv…...

华为OD机试真题Python实现【敏感字段加密】真题+解题思路+代码(20222023)

敏感字段加密 题目 给定一个由多个命令字组成的命令字符串; 字符串长度小于等于127字节,只包含大小写字母,数字,下划线和偶数个双引号命令字之间以一个或多个下划线_进行分割可以通过两个双引号""来标识包含下划线_的命令字或空命令字(仅包含两个双引号的命令字…...

我的 System Verilog 学习记录(1)

引言 技多不压身,准备开始学一些 System Verilog 的东西,充实一下自己,这个专栏的博客就记录学习、找资源的一个过程,希望可以给后来者一些借鉴吧,IC找工作的都加把油! 本文是准备先简单介绍一下环境搭建…...

金三银四,我不允许你们不知道这些软件测试面试题

01、您所熟悉的测试用例设计方法都有哪些?请分别以具体的例子来说明这些方法在测试用例设计工作中的应用。 答:有黑盒和白盒两种测试种类,黑盒有等价类划分法,边界分析法,因果图法和错误猜测法。白盒有逻辑覆盖法&…...

【UnityEditor】Unity将Multiple Sprite分割成多张png小图

如题,代码如下 using UnityEngine; using UnityEditor; using System.IO;public class SplitTexture {[MenuItem("ExtraTools/SplitTexture")]static void DoSplitTexture(){// 获取所选图片Texture2D selectedImg Selection.activeObject as Texture2D…...

独立搭建 handle server

本节主要介绍,如何搭建一个与 GHR隔离的 handle sever,不与外界有任何连通。 下载文件 访问地址下载最新版:http://www.handle.net/download_hnr.html 这里以 9.3.0 版本作为讲解 解压服务端,解压客户端 # 解压 tar -xzvf handle-9.3.0-distribution.tar.gz# 到目录下 …...