数据库知识总结
数据库知识点总结个人向。
目录
- 第一章 绪论
- 第二章 关系数据库
- 第三章 关系数据库标准语言SQL
- 第四章 数据库安全性
- 第五章 数据库完整性
- 第六章 关系数据理论
- 第七章 数据库设计
- 第十章 数据库恢复技术
- 第十一章 并发控制
第一章 绪论
数据(data): 描述事物的符号记录。
数据库(DataBase,DB): 数据库是长期存储在计算机内、有组织的、可共享的大量数据的集合。
数据库管理系统(DBMS): 数据库管理系统是位于用户与操作系统之间的一层数据管理软件。
数据库系统(DBS): 数据库系统是由数据库
、数据库管理系统(及开发工具)
、应用程序
和数据库管理员(DBA)
组成的存储、管理、处理和维护数据的系统。
数据库发展技术的发展阶段:
- 人工智能阶段
- 文件系统阶段
- 数据库系统阶段
数据库系统的特点:
- 数据结构化。
- 数据的共享性高,冗余度低且易扩充。
- 数据独立性高。
- 数据由数据库管理系统统一管理和控制。
数据模型的组成要素:数据结构、数据操作、数据的完整性约束条件。
- 数据结构:描述系统的静态特性,描述数据库的组成对象以及对象之间的关系。
- 数据操作:描述系统的动态特性,是对数据库中各种对象的实例所允许的操作的集合,其类型有查询和更新(增删改)。
- 数据的完整性约束条件:用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确,有效与相容。完整性约束条件是一组完整性规则的集合。
数据模型: 分为概念模型
,逻辑模型
,和物理模型
。
按照模型应用的不同目的,可以将模型分为两大类。
- 概念模型
- 逻辑模型和物理模型。
逻辑模型:
- 层次模型
- 网状模型
- 关系模型
实体: 客观存在并可相互区别的事物称为实体。
属性: 实体所具有的某一个特性称为属性。
码(key): 唯一标识实体的属性集称为码。
实体集: 同一类型实体的集合称为实体集。
联系: 实体之间的联系通常指的是不同实体集之间的联系。
实体直接的联系有:
- 一对一。
- 一对多。
- 多对多。
数据独立性:包括数据的物理独立性和逻辑独立性。
- 物理独立性:是指用户的应用程序与数据库中数据的物理存储是相互独立的。
- 逻辑独立性:是指用户的应用程序与数据库的逻辑结构是相互独立的。
关系代数的运算: 并、差、交。
数据库系统的三级模式结构
模式: 模式也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
外模式: 外模式也称子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑结构。
内模式: 内模式也称存储模式,一个数据库只有一个内模式。它是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式。
数据库的二级映像功能与数据独立性
- 外模式/模式映像:保证了数据的逻辑独立性。
- 模式/内模式映像:保证了数据的物理独立性。
层次模型用树形结构,网状模型用网状结构。
关系模型:
- 关系: 表
- 关系名: 表名
- 关系模式: 表头
- 关系: 二维表
- 元组:记录或行
- 属性: 列
- 属性名: 列名
- 属性值: 列值
- 分量: 一条记录中的一个列值
- 码: 唯一确定一个元组
- 域: 域是一组具有相同数据类型的值的集合
- 非规范关系:表中有表
关系的完整性约束条件:
- 实体完整性
- 参照完整性
- 用户定义的完整性
第二章 关系数据库
关系模式:对关系的描述。
那么什么是关系? 关系是一张表,一张二维表。
关系语言的分类:
- 关系代数语言
- 关系演算语言
- SQL语言
关系代数运算符:
- 集合运算符:
- 并
- 差
- 交
- 笛卡尔积。
- 关系运算符:
- 选择:得到表中指定行。
- 投影:得到表中指定列。
- 连接: 将两个表根据指定条件连接在一起。
- 自然连接
- 悬浮连接
- 外连接
- 左外连接
- 右外连接
- 除
候选码: 某一属性的值可以唯一地标识一个元组,而其子集不能。
主码: 若一个关系有多个候选码则选定其中一个为主码。
第三章 关系数据库标准语言SQL
数据定义语言DDL,数据查询语言DQL,数据操纵语言DML,数据控制语言DCL
SQL语句的特点
- 综合统一。
- 高度非过程化。
- 面向集合的操作方式。
- 以同一种语法结构提供多种使用方式。
- 语言简洁,易学易用。
数据查询:
- SELECT(查询)
数据定义:
- CREATE(创建)
- DROP(删除)
- ALTER(更改)
数据操纵:
- INSERT(增)
- UPDATE(更新)
- DELETE(改)
数据控制:
- GRANT(授予)
- REVOKE(回收)
数据类型:
模式:
- 模式的创建:
CREATE SCHEMA
- 模式的删除:
DROP SCHEMA
定义模式
在SQL中模式定义语句如下:CREATE SCHEMA <模式名> AUTHORIZATION <用户名>
表:
- 表的创建:
CREATE TABLE
- 表的删除:
DROP TABLE
- 表的修改:
ALTER TABLE
视图:
- 视图的创建:
CREATE VIEW
- 视图的删除:
DROP VIEW
索引:
- 索引的创建:
CREATE INDEX
- 索引的删除:
DROP INDEX
- 修稿索引:
ALTER INDEX
常用的比较条件:
=, > ,< ,>= ,<= , !=,<>(不等于) ,!> ,!< ,NOT+上述比较运算符
多重条件:
- AND
- OR
- NOT
常用的范围符:
- BETWEEN AND
- NOT BETWEEN AND
确定集合:
- IN
- NOT IN
字符匹配
LIKE可以用来进行字符串的匹配。
- 一般语法格式如下:
[NOT] LIKE '<匹配字符串>'
- 其含义是查找指定的属性值与<匹配串>相匹配的元组。
- <匹配串>可以是一个完整的字符串,也可以含有通配符%和_。
- %代表任意长度(长度可以为0)的字符串。
例如:a%b,表示以a为开头b结尾的任意长度的字符串。 - _代表任意单个字符。
例如:a_b,表示以a为开头b结尾的长度为3的字符串。
- %代表任意长度(长度可以为0)的字符串。
空值:
- IS NULL
- IS NOT NULL
数据查询
SQL提供了SELECT语句进行数据查询,该语句具有灵活的使用方式和丰富的功能。
其一般格式为:
SELECT [ALL | DISTINCT] <目标列表达式> [,<目标列表达式>]...
FROM <表名或视图名> [,<表名或视图名....>] | (<SELECT语句>) [AS] <别名>
[WHERE <条件表达式>]
[GROUP BY <列名1> [HAVING<条件表达式>]]
[ORDER BY <列名2> [ASC | DESC]];
上述语句的含义是,根据WHERE子句的条件表达式从FROM子句指定的基本表、视图或派生表中找出满足条件的元组,
再按SELECT子句中的目标列表达式选出元组中的属性值形成结果表。
如果有GROUP BY 子句,则将结果按<列名1>的值进行分组,该属性列值相等的元组为一个组。
通常会在每组中作用聚集函数。如果GROUP BY 子句带HAVING 短语,则只有满足指定条件的组才输出。
如果有ORDER BY子句,则结果表还要按<列名2>的值的升序或降序排序。
第四章 数据库安全性
数据库的不安全因素:
- 非授权用户对数据库的恶意存取和破坏。
- 数据库中重要或敏感的数据被泄露。
- 安全环境的脆弱性。
数据库安全性控制:
- 用户身份鉴别
- 弱口令鉴别
- 动态口令鉴别
- 生物特征鉴别
- 智能卡鉴别
- 存取控制
- 自主存取控制方法
为什么要授权:
授权是指授予(GRANT)和收回(REVOKE),是数据库安全性控制中的自主存取控制方法,是为了保护数据库,防止不合法使用所造成的数据泄露,更改或破坏。
如何授权: 授予(GRANT)。
收回授权: 收回(REVOKE)。
第五章 数据库完整性
数据库的完整性是指数据库的正确性和相容性。
- 正确性:符合现实世界语义。
- 相容性:同一对象在不同表中的数据符合逻辑。
维护完整性需要实现的功能:
- 提供定义完整性约束条件的机制。
- 提供完整性检查的方法。
- 进行违约处理。
三大完整性:
- 实体完整性:主码唯一且非空。
- 参照完整性:外码的约束。
- 用户定义的完整性:属性上约束条件的定义。
第六章 关系数据理论
函数依赖:
- 非平凡的函数依赖:X→\rightarrow→Y,Y∉Y\notinY∈/X
- 平凡的函数依赖:X→\rightarrow→Y,Y∈Y\inY∈X
- 完全函数依赖:X→\rightarrow→Y,并且对于X的任意子集X1,都有X≠>X\neq>X=>Y,则称Y完全函数依赖于X,记作X→(F在箭头上)\rightarrow(F在箭头上)→(F在箭头上)Y
- 部分函数依赖:Y不完全函数依赖于X,记作X→\rightarrow→(P在箭头上)Y,例如A→\rightarrow→C,又有AB→\rightarrow→C,那么C就是部分函数依赖于AB的,这种情况会造成数据冗余。
候选码: 是一个属性组(或者属性),通过该属性组能推出所有的属性,并且该属性组的任意子集都不能再推出所有属性了。即在满足完全函数依赖的前提下,还得是最小的属性组。
超码: 能推出所有属性的属性组的集合,根据概念可知,候选码是极小的超码集,是超码的子集。
主码: 当有多个候选码时,推出一个作为主码简称码。
主属性: 包含在任何一个候选码中的属性。
非主属性: 不包含在任意一个候选码中的属性。
外码: 关系模式R中,若有一个属性或属性组X,它不是R的码,但X是另一个关系模式S中的码,称X是R的外码。
全码: 最极端的情况下,整个属性组都是码,称为全码。
范式:
- 1NF: 所有属性都是不可分割的数据项。
如果某个属性,例如: 学校,还可以继续拆分为高中和大学,就不满足1NF了。
1NF是关系数据中需要满足的最低要求。 - 2NF: 在满足1NF的前提下,不包含非主属性对码的部分函数依赖。(即每一个非主属性都完全函数依赖于码)。
例如在关系R中,码是学号和班级,非主属性是姓名。因为通过学号就能直接推出姓名了,不需要班级,此处姓名就部分依赖于码,不满足2NF。 - 3NF: 在满足2NF的前提下,不包含非主属性对码的传递函数依赖(即码应该直接决定非主属性,不能间接决定)。
传递函数依赖: 传递函数依赖属于关系模式R(U),传递函数依赖在关系模式 R(U)中,设 X,Y,Z 是 U 的不同的属性子集,如果 X 确定 Y、Y 确定 Z,且有 X 不包含 Y,Y 不确定 X,(X∪Y)∩Z=空集合,则称 Z 传递函数依赖于X。 - BCNF: 消除任何属性对候选码的传递依赖,即每一个决定因素都包含码,表现为在函数依赖集当中,左边的都包含候选码(整个属性组)。
- 4NF: 不允许有非平凡且非函数依赖的多值依赖。
第七章 数据库设计
数据库设计的基本步骤:
- 需求分析。
- 概念结构设计。
- 逻辑结构分析。
- 物理结构分析。
- 数据库实施。
- 数据库运行和维护。
第十章 数据库恢复技术
事物的概念:
事物是数据库操作序列,这些操作要么全做,要么全不做,是不可分割的工作单位,一个事物可以是一个sql语句,一组sql语句或者整个程序,一般来说,一个程序包含多个事物。
事物是恢复的基本单位,也是并发控制的基本单位。
事物的4个特性(ACID):原子性,一致性,隔离性,持续性。
- 原子性:一个事物要么全做,要么全不做。
- 一致性:事物执行的结果必须一致,如果一个事物被迫中断,即事物中的一些操作做了,剩下的还没做,且做了的对数据库造成的修改已经存入物理数据库的话,就会造成数据库处于不一致的状态。因此事物要么全做,要么全不做,一致性和原子性是密切相关的。
- 隔离性:一个事物的执行不能被其他事物干扰。
- 持续性(也称永久性):一个事物一旦提交,它对数据库中数据的改变应该是永久性的。
数据库系统的故障种类:事物内部的故障,系统故障,介质故障,计算机病毒。
数据库恢复技术:数据转储,登录日志条件。
第十一章 并发控制
并发控制: 为了保证事物的隔离性和一致性,数据库管理系统需要对并发操作进行正确调度。
并发控制的主要技术有: 封锁、时间戳、乐观控制性、多版本并发控制的能够。
并发控制的基本方法:封锁(X锁,S锁)
- 排他锁/写锁,X锁
- 共享锁/读锁,,S锁。
封锁协议:约定何时申请X锁/S锁,持续时间,何时释放等等。
- 一级封锁协议。
- 二级封锁协议。
- 三级封锁协议。
相关文章:

数据库知识总结
数据库知识点总结个人向。 目录第一章 绪论第二章 关系数据库第三章 关系数据库标准语言SQL第四章 数据库安全性第五章 数据库完整性第六章 关系数据理论第七章 数据库设计第十章 数据库恢复技术第十一章 并发控制第一章 绪论 数据(data): 描述事物的符号记录。 数据库(DataB…...

处理数组循环中删除元素导致索引错位情况
就是很多时候我们对一个数组进行操作的时候,在for遍历的过程中删掉了一个元素,那么在删掉那个元素之后的所有元素的索引值都会减少一位,数组长度缩短一位,删完之后,正在进行的循环会继续循环下去,但是循环的…...

快速排序,分治法实际应用(含码源与解析)
🎊【数据结构与算法】专题正在持续更新中,各种数据结构的创建原理与运用✨,经典算法的解析✨都在这儿,欢迎大家前往订阅本专题,获取更多详细信息哦🎏🎏🎏 🪔本系列专栏 -…...

linux入门---操作体统的概念
什么是操作系统 操作系统是一个对软硬件资源进行管理的软件。计算机由一堆硬件组成,这些硬件遵循着冯诺依曼体系结构 在这个硬件的基础上还有一个软件叫做操作系统 操作系统的任务是对硬件进行管理,既然是管理的话操作系统得访问到底层的硬件…...

《Qt 6 C++开发指南》提供4个版本的示例程序
《Qt 6 C开发指南》包含丰富的示例项目,为了方便读者使用《Qt 6 C开发指南》学习Qt编程,本书提供了4个版本的示例程序。读者可在人民邮电出版社异步社区本书的配套资源(如图1)里下载这4个版本的示例程序。图1 异步社区本书配套资源…...

chartgpt 告诉我的,loss 函数的各种知识
一、libtorch中常见的损失函数及其使用场景的总结1. CrossEntropyLoss:CrossEntropyLoss(交叉熵损失)主要用于分类任务。它适用于多分类问题,其中每个样本只属于一个类别(互斥)。该损失函数将预测概率与真实标签的one-…...

旅行推销员问题的遗传算法中的完整子路线顺序交叉
摘要 旅行商问题(TSP)是许多著名的组合问题之一。TSP可以解释为很难找到从第一个城市出发,经过所有城市,然后返回起点的最短距离。在标准问题中,TSP通常用于确定新算法的效率。遗传算法是求解TSP问题的一种成功算法。…...

Python实现词频统计
词频统计是自然语言处理的基本任务,针对一段句子、一篇文章或一组文章,统计文章中每个单词出现的次数,在此基础上发现文章的主题词、热词。 1. 单句的词频统计 思路:首先定义一个空字典my_dict,然后遍历文章…...

微信小程序面试题(day08)
文章目录微信小程序自定义组件的使用?微信小程序事件通道的使用?微信小程序如何使用vant组件库?微信小程序自定义组件父传子子传父?微信小程序自定义组件生命周期有哪些?微信小程序授权登录流程?web-view。…...

最强的Python可视化神器,你有用过么?
数据分析离不开数据可视化,我们最常用的就是Pandas,Matplotlib,Pyecharts当然还有Tableau,看到一篇文章介绍Plotly制图后我也跃跃欲试,查看了相关资料开始尝试用它制图。 1、Plotly Plotly是一款用来做数据分析和可视…...

Ubuntu使用vnc远程桌面【远程内网穿透】
文章目录1.前言2.两台互联电脑的设置2.1 Windows安装VNC2.2 Ubuntu安装VNC2.3.Ubuntu安装cpolar3.Cpolar设置3.1 Cpolar云端设置3.2.Cpolar本地设置4.公网访问测试5.结语1.前言 记得笔者刚刚开始接触电脑时,还是win95/98的时代,那时的电脑桌面刚迈入图形…...

【C++】map、set、multimap、multiset的介绍和使用
我讨厌世俗,也耐得住孤独。 文章目录一、键值对二、树形结构的关联式容器1.set1.1 set的介绍1.2 set的使用1.3 multiset的使用2.map2.1 map的介绍2.2 map的使用2.3 multimap的使用三、两道OJ题1.前K个高频单词(less<T>小于号是小的在左面升序&…...

css学习14(多媒体查询)
目录 多媒体查询 语法 示例代码 通用媒体查询 媒体功能参考列表 多媒体查询 CSS的媒体查询是一种CSS的技术,它可以根据不同的设备类型、屏幕尺寸、方向、分辨率等条件来应用不同的CSS样式,从而为不同的设备和屏幕提供最佳的浏览体验。这样ÿ…...

【C++进阶】C++11(中)左值引用和右值引用
文章目录左值引用左值引用的概念左值引用的使用右值引用右值引用的概念右值引用的使用左右值相互引用左值引用对右值进行引用右值引用对左值进行引用右值引用使用场景和意义左值引用的优势左值引用的短板右值引用的优势完美转发模板万能引用完美转发实际运用场景左值引用 左值…...

Python中的生成器【generator】总结,看看你掌握了没?
人生苦短,我用python python 安装包资料:点击此处跳转文末名片获取 1.实现generator的两种方式 python中的generator保存的是算法, 真正需要计算出值的时候才会去往下计算出值。 它是一种惰性计算(lazy evaluation)。 要创建一个…...

MD5加密竟然不安全,应届生表示无法理解?
前言 近日公司的一个应届生问我,他做的一个毕业设计密码是MD5加密存储的,为什么密码我帮他调试的时候,我能猜出来明文是什么? 第六感,是后端研发的第六感! 正文 示例,有个系统,前…...

【Linux】虚拟地址空间
进程地址空间一、引入二、虚拟地址与物理内存的联系三、为什么要有虚拟地址空间一、引入 对于C/C程序,我们眼中的内存是这样的: 我们利用这种对于与内存的理解看一下下面这段代码: 运行结果: 观察父子进程中 val 变量的值&…...

四平方和题解(二分习题)
四平方和 暴力做法 Y总暴力做法,蓝桥云里能通过所有数据 总结:暴力也分好坏,下面这份代码就是写的好的暴力 如何写好暴力:1. 按组合枚举 2. 写好循环结束条件,没必要循环那么多次 #include<iostream> #include<cmath>…...

一篇文章搞定js正则表达式
我们测试正则表达式是否正确的方法有很多,例如通过正则表达式找到拼配的字符串: 在vscode编辑器中点击搜索框中的第三个按钮就可以实现: 或者 在浏览器中的控制台也可以实现: 我们可以通过下面的在线网站来测试你写的正则是否正确…...

[数据结构] 用两个队列实现栈详解
文章目录 一、队列实现栈的特点分析 1、1 具体分析 1、2 整体概括 二、队列模拟实现栈代码的实现 2、1 手撕 队列 代码 queue.h queue.c 2、2 用队列模拟实现栈代码 三、总结 🙋♂️ 作者:Ggggggtm 🙋♂️ 👀 专栏࿱…...

官宣|Apache Flink 1.17 发布公告
Apache Flink PMC(项目管理委员)很高兴地宣布发布 Apache Flink 1.17.0。Apache Flink 是领先的流处理标准,流批统一的数据处理概念在越来越多的公司中得到认可。得益于我们出色的社区和优秀的贡献者,Apache Flink 在 Apache 社区…...

动态内存管理+动态通讯录【C进阶】
文章目录为什么存在动态内存分配❓👉动态内存函数👈malloc&freecallocrealloc❌常见的动态内存错误❌练习题🫠C/C程序的内存开辟🤔柔性数组柔性数组的特点柔性数组的优势:star:动态通讯录:star:初始化添加销毁为什么存在动态内…...

基于pytorch+Resnet101加GPT搭建AI玩王者荣耀
本源码模型主要用了SamLynnEvans Transformer 的源码的解码部分。以及pytorch自带的预训练模型"resnet101-5d3b4d8f.pth"本资源整理自网络,源地址:https://github.com/FengQuanLi/ResnetGPT注意运行本代码需要注意以下几点 注意!&a…...

多线程控制讲解与代码实现
多线程控制 回顾一下线程的概念 线程是CPU调度的基本单位,进程是承担分配系统资源的基本单位。linux在设计上并没有给线程专门设计数据结构,而是直接复用PCB的数据结构。每个新线程(task_struct{}中有个指针都指向虚拟内存mm_struct结构&am…...

清晰概括:进程与线程间的区别的联系
相关阅读: 🔗通俗简介:操作系统之进程的管理与调度🔗如何使用 jconsole 查看Java进程中线程的详细信息? 目录 一、进程与线程 1、进程 2、线程 二、进程与线程之间的区别和联系 1、区别 2、联系 一、进程与线程 …...

自定义类型 (结构体)
文章目录📬结构体的声明🔎1.结构的基础知识🔎2.结构的声明🔎3.特殊的声明🔎4.结构的自引用🔎5.结构体变量的定义和初始化🔎6.结构体内存对齐🔎7.修改默认对齐数🔎8.结构体…...

第14届蓝桥杯STEMA测评真题剖析-2023年3月12日Scratch编程初中级组
[导读]:超平老师的《Scratch蓝桥杯真题解析100讲》已经全部完成,后续会不定期解读蓝桥杯真题,这是Scratch蓝桥杯真题解析第113讲。 蓝桥杯选拔赛现已更名为STEMA,即STEM 能力测试,是蓝桥杯大赛组委会与美国普林斯顿多…...

程序员接私活一定要知道的事情,我走的弯路你们都别走了
文章目录前言一、程序员私活的种类1.兼职职位众包2.自由职业者驻场3.项目整包二、这3种私活可以接1.有熟人2.七分熟的项目3.需求明确的项目三、这3种私活不要接1.主动找上门的中介单2.一味强调项目简单好做3.外行人给你拉的项目四、接单的渠道1.线下渠道2.线上渠道3.比较靠谱的…...

十二届蓝桥杯省赛c++(下)
1、 拿到题目一定要读懂题意,不要看到这题目就上来模拟什么闰年,一月的天数啥的。这个题目问你当天的时间,就说明年月日跟你都没关系,直接无视就好了。 #include <iostream> #include <cstring> #include <algori…...

数据结构与算法——堆的基本存储
目录 一、概念及其介绍 二、适用说明 三、结构图示 四、Java 实例代码 五.堆和栈的区别 一、概念及其介绍 堆(Heap)是计算机科学中一类特殊的数据结构的统称。 堆通常是一个可以被看做一棵完全二叉树的数组对象。 堆满足下列性质: 堆中某个节点的值总是不大…...