当前位置: 首页 > news >正文

【软件系统架构】系列三:数据库系统之三

1.数据故障与备份

1.1 安全措施

措施说明
用户标识和鉴定最外层的安全保护措施,可以使用用户帐户、口令及随机数检验等方式
存取控制对用户进行授权,包括操作类型(如查找、插入、删除、修改等动作)和数据对象(主要是数据范围)的权限。
密码存储和传输对远程终端信息用密码传输
视图的保护对视图进行授权
审计使用一个专用文件或数据库,自动将用户对数据库的所有操作记录下来

1.2 数据故障

故障关系故障原因解决方法
事务本身的可预期故障本身逻辑在程序中预先设置Rollback语句
事务本身的不可预期故障算术溢出、违反存储保护由DBMS的恢复子系统通过日志,撤销事务对数据库的修改,回退到事务初始状态
系统故障系统停止运转通常使用检查点法
介质故障外存被破坏一般使用日志重做业务

1.3 数据备份

1.3.1 静态转储(冷备份)

  • 定义: 在转储期间不允许对数据库进行任何存取、修改操作。

  • 优点:非常快速的备份方法。

    • 容易归档(直接物理复制操作)。

  • 缺点:

    • 只能提供到某一时间点上的恢复。

    • 不能做其他工作。

    • 不能按表或按用户恢复。

1.3.2 转储(热备份)

  • 定义: 在转储期间允许对数据库进行存取、修改操作,因此,转储和用户事务可并发执行。

  • 优点:

    • 可在表空间或数据库文件级备份。

    • 数据库仍可使用。

    • 可达到秒级恢复。

  • 缺点:

    • 不能出错,否则后果严重。

    • 若热备份不成功,所得结果几乎全部无效。

1.3.3 完全备份

  • 定义: 备份所有数据。

1.3.4 差量备份

  • 定义: 仅备份上一次完全备份之后变化的数据。

1.3.5 增量备份

  • 定义: 备份上一次备份之后变化的数据。

1.3.6 日志文件

  • 定义: 在事务处理过程中,DBMS把事务开始、事务结束以及对数据库的插入、删除和修改的每一次操作写入日志文件。

  • 作用: 一旦发生故障,DBMS的恢复子系统利用日志文件撤销事务对数据库的改变,回退到事务的初始状态。

  • 重要性: 备份毕竟是有时间节点的,不是实时的。例如:上一次备份到这次备份之间数据库出现了故障,则这期间的数据无法恢复。因此,引入日志文件,可以实时记录针对数据库的任何操作,保证数据库可以实时恢复。

2.分布式数据库

分布式数据库是一个由多个物理上分散的数据库组成的逻辑统一的数据库系统。这些物理上分散的数据库通过网络连接,协同工作,为用户提供统一的数据访问接口。

分布式数据库
分布式数据库

分布式数据库的特点:

  • 物理分布性: 数据存储在不同的物理位置。

  • 逻辑整体性: 虽然数据分散存储,但用户感觉像是在操作一个单一的数据库。

  • 站点自治性: 每个局部数据库都有一定的自治能力。

  • 数据分布透明性: 用户无需关心数据的具体分布情况。

分布式数据库的优势:

  • 高可用性: 部分节点故障不影响整体服务。

  • 高扩展性: 可以通过增加节点来扩展存储和处理能力。

  • 性能提升: 可以将数据分布在离用户更近的位置,减少网络延迟。

分片模式

  • 水平分片: 将表中水平的记录分别存放在不同的地方。

  • 垂直分片: 将表中的垂直的列值分别存放在不同的地方。

分布式数据库的透明性:

  • 分片透明性: 用户无需知道数据是如何分片存储的。

  • 位置透明性: 用户无需知道数据存储在哪个物理位置。

  • 逻辑透明性: 用户无需知道局部数据库使用的数据模型。

  • 复制透明性: 用户无需知道数据的复制情况。

3.数据仓库与数据挖掘

3.1 数据仓库

  • 定义: 数据仓库是一种特殊的数据库,也是按数据库形式存储数据的,但是目的不同。数据库经过长时间的运行,里面的数据会保存的越来越多,就会影响系统运行效率。对于某些程序而言,很久之前的数据并非必要的,因此,可以删除掉以减少数据,增加效率,考虑到删除这些数据比较可惜,因此,一般都将这些数据从数据库中提取出来保存到另外一个数据库中,称为数据仓库。

3.2 数据仓库四大特点

  • 面向主题: 按照一定的主题域进行组织的。

  • 集成的: 数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

  • 相对稳定的: 数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

  • 反映历史变化: 数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时间点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

3.3 数据仓库的结构通常包含四个层次

如下图所示:

数据仓库体系架构
数据仓库体系架构

(1)数据源: 是数据仓库系统的基础,是整个系统的数据源泉。

(2)数据的存储与管理: 是整个数据仓库系统的核心。

(3)OLAP(联机分析处理)服务器: 对分析需要的数据进行有效集成,按多维模型组织,以便进行多角度、多层次的分析,并发现趋势。

(4)前端工具: 主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。

3.4 数据挖掘的分析方法

  • 关联分析: 主要用于发现不同事件之间的关联性,即一个事件发生的同时,另一个事件也经常发生。

  • 序列分析: 主要用于发现一定时间间隔内接连发生的事件,这些事件构成一个序列,发现的序列应该具有普遍意义。

  • 分类分析: 通过分析具有类别的样本特点,得到决定样本属于各种类别的规则或方法。

    • 分类分析时首先为每个记录赋予一个标记(一组具有不同特征的类别),即按标记分类记录,然后检查这些标定的记录,描述出这些记录的特征。

  • 聚类分析: 是根据“物以类聚”的原理,将本身没有类别的样本聚集成不同的组,并且对每个这样的组进行描述的过程。

3.5 商业智能 BI

  • BI系统主要包括数据预处理、建立数据仓库、数据分析和数据展现四个主要阶段。

  • 数据预处理: 是整合企业原始数据的第一步,它包括数据的抽取(Extraction)、转换(Transformation)和加载(Load)三个过程(ETL过程);

  • 建立数据仓库: 则是处理海量数据的基础;

  • 数据分析: 是体现系统智能的关键,一般采用联机分析处理(OLAP)和数据挖掘两大技术。

    • 联机分析处理: 不仅进行数据汇总/聚集,同时还提供切片、切块、下钻、上卷和旋转等数据分析功能,用户可以方便地对海量数据进行多维分析。

    • 数据挖掘: 的目标则是挖掘数据背后隐藏的知识,通过关联分析、聚类和分类等方法建立分析模型,预测企业未来发展趋势和将要面临的问题;

  • 数据展现: 在海量数据和分析手段增多的情况下,数据展现则主要保障系统分析结果的可视化。

4.反规划化技术

背景:

  • 规范化操作可以防止插入异常、更新、删除异常和数据冗余,一般是通过模式分解,将表拆分,来达到这个目的。

  • 但是表拆分后,解决了上述异常,却不利于查询,每次查询时,可能都要关联很多表,严重降低了查询效率。

目的:

  • 提高查询效率。

技术手段:

  • 增加派生性冗余列

  • 增加冗余列

  • 重新组表

  • 分割表

本质:

  • 主要就是增加冗余,提高查询效率,为规范化操作的逆操作。

5.SQL语言

5.1 SQL 语言中的语法关键字

  • 创建表: create table

  • 指定主键: primary key()

  • 指定外键: foreign key()

  • 修改表: alter table

  • 删除表: drop table

  • 索引: index

  • 视图: view

  • 数据库查询: select...from...where

  • 分组查询: group by

    • 分组时要注意 select 后的列名要适应分组

    • having 为分组查询附加条件

  • 更名运算: as

  • 字符串匹配: like

    • % 匹配多个字符串

    • _ 匹配任意一个字符串

  • 数据库插入: insert into...values()

  • 数据库删除: delete from...where

  • 数据库修改: update...set...where

  • 排序: order by

    • 默认为升序

    • 降序要加关键字 DESC

  • 授权: grant...on...to

    • with grant option:允许其将权限再赋给另一用户

  • 收回权限: revoke...on...from

  • with check option 表示要检查 where 后的谓词条件

  • DISTINCT 过滤重复的选项,只保留一条记录

  • UNION 出现在两个 SQL 语句之间,将两个 SQL 语句的查询结果取或运算,即值存在于第一句或第二句都会被选出

  • INTERSECT 对两个 SQL 语句的查询结果做与运算,即值同时存在于两个语句才被选出

5.2 SQL 语法原理

  • SELECT 之后的为要查询显示的属性列名

  • FROM 后面是要查询的表名

  • WHERE 后面是查询条件

  • 涉及到平均数、最大值、求和等运算,必须要分组,group by 后面是分组的属性列名,分组的条件使用 Having 关键字,后面跟条件

  • 在 SQL 语句中,条件判断时数字无需打引号,字符串要打单引号

6.NoSQL数据库

6.1 定义:

  • NoSQL 最常见的解释是 Non-Relational(非关系型),Not Only SQL 也被很多人接受。

  • NoSQL 仅仅是一个概念,泛指非关系型的数据库,区别于关系数据库。

  • 它们不保证关系数据的 ACID 特性。

6.2 数据模型分类:

  • 按照所使用的数据结构的类型,一般可以将 NoSQL 数据库分为以下 4 种类型:

        列式存储数据库:
    • 行式数据库即传统的关系型数据库,数据按记录存储,每一条记录的所有属性存储在一行。

    • 列式数据库是按数据库记录的列来组织和存储数据的,数据库中每个表由一组页链的集合组成,每条页链对应表中的一个存储列。

        键值对存储数据库:
    • 键值存储的典型数据结构一般为数组链表:先通过 Hash 算法得出 Hashcode,找到数组的某一个位置,然后插入链表。

        文档型数据库:
    • 文档型数据库同键值对存储数据库类似。

    • 该类型的数据模型是版本化的文档,半结构化的文档以特定的格式存储,比如 JSON。

        图数据库:
    • 图形结构的数据库同其他采用行列以及刚性结构的 SQL 数据库不同,它使用灵活的图形模型,并且能够扩展到多个服务器上。

    • NoSQL 数据库没有标准的查询语言 (SQL),因此进行数据库查询需要指定数据模型。

    6.3 NoSQL 数据库的共同特征:

    • 目前业界对于 NoSQL 并没有一个明确的范围和定义,但是它们普遍存在下面一些共同特征:

      • 易扩展: 去掉了关系数据库的关系型特性。数据之间无关系,这样就非常容易扩展。

      • 大数据量,高性能: NoSQL 数据库都具有非常高的读写性能,尤其在大数据量下。这得益于它的无关系性,数据库的结构简单。

      • 灵活的数据模型: NoSQL 无须事先为要存储的数据建立字段,随时可以存储自定义的数据格式。

      • 高可用: NoSQL 在不太影响性能的情况下,就可以方便地实现高可用的架构,有些产品通过复制模型也能实现高可用。

    6.4 NoSQL 整体框架:

    • NoSQL 整体框架分为 4 层,由下至上分为数据持久层、数据分布层、数据逻辑模型层和接口层。

      • (1) 数据持久层:

        • 定义了数据的存储形式,主要包括基于内存、硬盘、内存和硬盘接口、订制可插拔 4 种形式。

      • (2) 数据分布层:

        • 定义了数据是如何分布的,相对于关系型数据库,NoSQL 可选的机制比较多,主要有 3 种形式:

          • 一是 CAP 支持,可用于水平扩展;

          • 二是多数据中心支持,可以保证在横跨多数据中心时也能够平稳运行;

          • 三是动态部署支持,可以在运行着的集群中动态地添加或删除结点。

      • (3) 数据逻辑层:

        • 表述了数据的逻辑表现形式。

      • (4) 接口层:

        • 为上层应用提供了方便的数据调用接口,提供的选择远多于关系型数据库。

    6.4 NoSQL 分层架构:

    • NoSQL 分层架构并不代表每个产品在每一层只有一种选择。

    • 相反,这种分层设计提供了很大的灵活性和兼容性,每种数据库在不同层面可以支持多种特性。

    6.5 NoSQL 数据库适用情况:

    • NoSQL 数据库在以下这几种情况比较适用:

      • 数据模型比较简单;

      • 需要灵活性更强的 IT 系统;

      • 对数据库性能要求较高;

      • 不需要高度的数据一致性;

      • 对于给定 key,比较容易映射复杂值的环境。

    【软件系统架构】系列

    系统架构设计教程简介【软件系统架构】系列简介-CSDN博客
    【软件系统架构】系列三:数据库系统之一【软件系统架构】系列三:数据库系统之一_内模式映像-CSDN博客
    【软件系统架构】系列三:数据库系统之二【软件系统架构】系列三:数据库系统之二-CSDN博客
    【软件系统架构】系列三:数据库系统之三【软件系统架构】系列三:数据库系统之三-CSDN博客
    【软件系统架构】系列三:数据库系统之四-Redis数据库(1)https://blog.csdn.net/moton2017/article/details/145990776

    相关文章:

    【软件系统架构】系列三:数据库系统之三

    1.数据故障与备份 1.1 安全措施 措施说明用户标识和鉴定最外层的安全保护措施,可以使用用户帐户、口令及随机数检验等方式存取控制对用户进行授权,包括操作类型(如查找、插入、删除、修改等动作)和数据对象(主要是数…...

    lamp平台介绍

    一、lamp介绍 网站: 静态 动态 php语言 .php 作用:运行php语言编写动态网站应用 lamp Linux Apache MySQL PHP PHP是作为httpd的一个功能模块存在的 二、部署lamp平台 1、测试httpd是否可正常返回PHP的响应 2、测试PHP代码是否可正常连接数据…...

    826考研

    初试总分第一的hh佬小红书:https://www.xiaohongshu.com/user/profile/64e106aa000000000100fe33 深研院巨佬经验贴:https://zhuanlan.zhihu.com/p/690464528 本部羊神经验贴:https://zhuanlan.zhihu.com/p/689494655 本部学硕佬经验贴&#…...

    局域网自动识别机器名和MAC并生成文件的命令

    更新版本:添加了MAC 地址 确定了设备唯一性 V1.1 局域网自动识别机器名和MAC并生成文件的批处理命令 echo off setlocal enabledelayedexpansionREM 设置输出文件 set outputFilenetwork_info.txtREM 清空或创建输出文件 echo Scanning network from 192.168.20.1…...

    todo: 使用融云imserve做登录(android)

    使用融云做登录注册思路 注册界面需要name, email, password考虑到融云注册用户的post格式 POST http://api.rong-api.com/user/getToken.json?userId1690544550qqcom&nameIronman这里的userId可以使用用户的email,但是要截断和 . 符号,即1690544…...

    Mac OS升级后变慢了,如何恢复老系统?

    我的一台Mac Air闲置很久了,原因是某次系统升级后用着会卡,有差不多10年没用了。今天想试着恢复一下出厂系统,目前看这条路可以走通。记录如下: 1、去哪里下载旧版系统? https://support.apple.com/zh-cn/102662 2、…...

    cursor使用经验分享(java后端服务开发向)

    前言 cursor是一款基于vscode,并集成AI能力的代码编辑器,其功能包括但不限于代码生成及补全、AI对话(能够直接将代码环境作为上下文)、即时应用建议等等,是一款面向未来的代码编辑器。 对于vscode,最先想…...

    初次使用 IDE 搭配 Lombok 注解的配置

    前言 在 Java 开发的漫漫征程中,我们总会遇到各种提升效率的工具。Lombok 便是其中一款能让代码编写变得更加简洁高效的神奇库。它通过注解的方式,巧妙地在编译阶段为我们生成那些繁琐的样板代码,比如 getter、setter、构造函数等。然而&…...

    vue 安装依赖npm install过程中报错npm ERR! cb() never called!

    解决办法: 步骤 1:清理 npm 缓存 npm cache clean --force rm -rf node_modules package-lock.json 步骤 2:一个第三方 npm 工具包,功能是 自动重试失败的 npm install 操作,适用于网络不稳定或依赖源不可靠的场景 …...

    android接入rocketmq

    一 前言 RocketMQ 作为一个功能强大的消息队列系统,不仅支持基本的消息发布与订阅,还提供了顺序消息、延时消息、事务消息等高级功能,适应了复杂的分布式系统需求。其高可用性架构、多副本机制、完善的运维管理工具,以及安全控制…...

    libilibi项目优化(1)使用Redis实现缓存

    第一版 获取视频信息使用旁路缓存 当视频信息存在缓存中时(命中),直接从缓存中获取。不存在缓存中时,先从数据库中查出对应的信息,写入缓存后再放回数据。 //获取视频详细信息RequestMapping("/getVideoInfo&q…...

    The Rust Programming Language 学习 (二)

    通用编程概念 变量和可变性 默认情况下变量是不可变的(immutable),不过你也可以选择让变量是可变的(mutable). 变量的遮蔽 你可以声明和前面变量具有相同名称的新变量,说这个是第一个变量被第二个变量遮蔽(shadow&…...

    http链接转成https的链接的几种方法

    以下是一个将HTTP链接转换为HTTPS的JavaScript函数,处理了多种常见输入情况: function convertToHttps(url) {if (typeof url ! string) return url;// 移除首尾空格并处理空字符串const trimmedUrl url.trim();if (!trimmedUrl) return https://;// 替…...

    STM32——串口通信 UART

    一、基础配置 Universal Asynchronous Receiver Transmitter 异步,串行,全双工 TTL电平 :高电平1 低电平0 帧格式: 起始位1bit 数据位8bit 校验位1bit 终止位1bit NVIC Settings一栏使能接受中断。 之前有设置LCD,…...

    mybatis日期格式与字符串不匹配bug

    异常特征:java.lang.IllegalArgumentException: invalid comparison: java.time.LocalDateTime and java.lang.String ### Error updating database. Cause: java.lang.IllegalArgumentException: invalid comparison: java.time.LocalDateTime and java.lang.Str…...

    文献分享: ConstBERT固定数目向量编码文档

    😂图放这了,大道至简的 idea \text{idea} idea不愧是 ECIR \text{ECIR} ECIR 👉原论文 1. ConstBERT \textbf{1. ConstBERT} 1. ConstBERT的原理 1️⃣模型的改进点:相较于 ColBERT \text{ColBERT} ColBERT为每个 Token \text{Tok…...

    学习记录-用例设计编写

    黑马测试视频记录 目录 一、 软件测试流程 二、测试用例编写格式 1、等价类法 2、边界值分析法 3、 判定表法 4、场景法​编辑 5、错误推荐法 一、 软件测试流程 二、测试用例编写格式 1、等价类法 2、边界值分析法 3、 判定表法 4、场景法 5、错误推荐法 时间紧任务重…...

    学习工具的一天之(burp)

    第一呢一定是先下载 【Java环境】:Java Downloads | Oracle 下来是burp的下载 Download Burp Suite Community Edition - PortSwigger 【下载方法二】关注的一个博主 【BurpSuite 安装激活使用详细上手教程 web安全测试工具】https://www.bilibili.com/video/BV…...

    el-tree右键节点动态位置展示菜单;el-tree的节点图片动态根据节点属性color改变背景色;加遮罩层(opacity)

    一、el-tree右键节点动态位置展示菜单 关键:@node-contextmenu="handleRightClick"与@node-click=“handleNodeClick” <div class="content"><el-tabs class="tabs" @tab-click="handleClick" v-model="Modal"…...

    K8s 1.27.1 实战系列(一)准备工作

    一、主机规划与硬件要求 1、节点数量 至少需要 3 台服务器(1 台 Master 节点,2 台 Worker 节点)。本地测试可缩容:若仅用于测试,可缩减为 1 个 Master 和 1 个 Worker,但需注意稳定性风险。2、硬件配置 ​Master 节点:建议 2 核 CPU、8GB 内存、80GB 硬盘。​Worker 节…...

    说一下SpringBoot3新特新和JDK17新特性

    JDK1.8&#xff08;Java8&#xff09;新特性 stream流式编程 流处理 Stream API 提供了对集合数据进行操作的一种高效、简洁的方式。它支持顺序和并行的聚合操作 如&#xff1a;过滤&#xff08;filter&#xff09;、排序&#xff08;sort&#xff09;、映射&#xff08;map&…...

    Linux系统服务安全检测手记

    一&#xff1a;服务器ip暴露ip和端口的安全问题 服务器IP和端口暴露在外网中确实存在一定的安全风险&#xff0c;以下是几个主要的安全问题及相应的缓解措施&#xff1a; ### 主要安全问题 1. **直接攻击**&#xff1a; - 暴露的IP地址和开放的端口可能成为黑客直接攻击的…...

    鸿蒙与DeepSeek深度整合:构建下一代智能操作系统生态

    前些天发现了一个巨牛的人工智能学习网站&#xff0c;通俗易懂&#xff0c;风趣幽默&#xff0c;忍不住分享一下给大家。点击跳转到网站。 https://www.captainbed.cn/north 目录 技术融合背景与价值鸿蒙分布式架构解析DeepSeek技术体系剖析核心整合架构设计智能调度系统实现…...

    [创业之路-329]:华为铁三角实施的步骤

    一、通用过程 华为铁三角实施的步骤主要包括以下几个关键阶段&#xff1a; 1、明确角色与职责 确定铁三角成员&#xff1a;组建由客户经理&#xff08;AR&#xff09;、解决方案经理&#xff08;SR&#xff09;和交付经理&#xff08;FR&#xff09;组成的铁三角团队。制定岗…...

    1.15-16-17-18迭代器与生成器,函数,数据结构,模块

    目录 15&#xff0c;Python3 迭代器与生成器15-1 迭代器15-1-1 基础知识15-1-2 迭代器与for循环工作原理 15-2 生成器&#xff08;本质就是迭代器&#xff09;15-2-1 yield 表达式15-2-2 三元表达式15-2-3 列表生成式15-2-4 其他生成器&#xff08;——没有元祖生成式——&…...

    java面向对象(详细讲解)

    第一章 类和对象 1.面向对象的介绍 1.面向过程&#xff1a;自己的事情自己做&#xff0c;代表语言c语言 2.面向对象&#xff1a;自己的事情别人做&#xff0c;代表语言java 3.为啥要使用面向对象思想编程&#xff1a;很多功能别人给我们实现好了&#xff0c;我们只需要拿过…...

    代码随想录二刷|图论2

    图论 基础知识 1 无向图 &#xff08;1&#xff09;度&#xff1a;一个顶点连n条边就度为n &#xff08;2&#xff09;权 加权无向图&#xff1a;有边长的无向图 &#xff08;3&#xff09;通道&#xff1a;两个顶点之间有一些边和点&#xff0c;并且没有重复的边 路&am…...

    毕业项目推荐:基于yolov8/yolov5/yolo11的暴力行为检测识别系统(python+卷积神经网络)

    文章目录 概要一、整体资源介绍技术要点功能展示&#xff1a;功能1 支持单张图片识别功能2 支持遍历文件夹识别功能3 支持识别视频文件功能4 支持摄像头识别功能5 支持结果文件导出&#xff08;xls格式&#xff09;功能6 支持切换检测到的目标查看 二、数据集三、算法介绍1. YO…...

    服务器CPU微架构

    1、微架构图 前端&#xff1a;预解码、解码、分支预测、L1指令缓存、指令TLB缓存 后端&#xff1a;顺序重排缓存器ROB处理依赖&#xff0c;调度器送到执行引擎 执行引擎&#xff1a;8路超标量&#xff0c;每一路可以进行独立的微操作处理 Port0、1、5、6支持整数、浮点数的加…...

    用本地浏览器打开服务器上使用的Tensorboard

    文章目录 前言一、Tensorboard的安装二、使用步骤1.服务器上的设置2.在本地打开 总结 前言 最近有使用服务器上的Tensorboard的需求&#xff0c;踩了几个雷&#xff0c;现已在搜索和帮助下解决&#xff0c;总结于此。 一、Tensorboard的安装 pip install tensorboard2.12.0注…...