深入理解数据库的三范式
数据库设计中的范式(Normal Form)是用于规范数据存储结构、消除冗余以及保证数据一致性的重要原则。范式的概念有多种层次,常用的前三种称为第一范式(1NF)、第二范式(2NF)和第三范式(3NF),分别为数据库设计提供了不同的规范和约束条件。
什么是数据库范式?
在数据库中,范式是一组用于组织表结构的规则。范式帮助设计者将数据表设计为逻辑上的最优结构,避免因冗余导致的数据不一致问题,同时提高数据的可维护性。通常情况下,数据库设计需要至少达到第三范式(3NF),以确保数据的一致性和存储的高效性。
1. 第一范式(1NF):消除重复列
定义:一个表格达到第一范式的要求是,表中每一个字段必须是原子性的,即不可再分。
在数据库设计中,每一列的值应该是一个单一的、不可分割的值。比如,在一个“学生”表中,如果希望存储学生的课程信息,而课程数据被设计成一个单元格中多个值的集合(例如,“数学, 英语, 科学”),则不符合第一范式。因为这个单元格的数据是可以再分的,不是原子值。
示例: 假设我们有一个“学生”表,其中记录了学生的选课信息:
| 学生ID | 姓名 | 课程 |
|---|---|---|
| 1 | 张三 | 数学, 英语 |
| 2 | 李四 | 物理, 化学, 生物 |
这种表不符合第一范式,因为“课程”列包含多个课程信息。
调整后:
为了符合第一范式,我们可以将“课程”列分开,每条记录只包含一个课程。
| 学生ID | 姓名 | 课程 |
|---|---|---|
| 1 | 张三 | 数学 |
| 1 | 张三 | 英语 |
| 2 | 李四 | 物理 |
| 2 | 李四 | 化学 |
| 2 | 李四 | 生物 |
通过这种方式,“课程”字段的每个值都是不可分的原子值,从而符合了第一范式。
2. 第二范式(2NF):消除部分依赖
定义:第二范式要求表格必须满足第一范式的要求,且所有非主属性(非候选码的属性)必须完全依赖于主键。换句话说,表中不能存在部分依赖。
第二范式主要用于有复合主键的情况,如果一个表的主键是由两个或多个字段组合而成,表中的非主属性必须依赖于主键的所有组成部分,而不能仅依赖于主键的某一部分。
示例: 假设我们有一个“课程登记”表,其中包含了学生的选课信息:
| 学生ID | 课程ID | 课程名称 |
|---|---|---|
| 1 | 101 | 数学 |
| 1 | 102 | 英语 |
| 2 | 103 | 物理 |
这里的主键是“学生ID + 课程ID”组合。在这个表中,“课程名称”只依赖于“课程ID”而非“学生ID”,所以它是部分依赖,不符合第二范式。
调整后:
为了符合第二范式,可以将表拆分成两个表:
-
“课程登记”表,记录学生的选课信息:
学生ID 课程ID 1 101 1 102 2 103 -
“课程信息”表,记录课程的详细信息:
课程ID 课程名称 101 数学 102 英语 103 物理
现在,“课程名称”完全依赖于“课程ID”,而“课程登记”表中的非主属性完全依赖于“学生ID + 课程ID”复合主键,从而符合了第二范式。
3. 第三范式(3NF):消除传递依赖
定义:第三范式要求表格必须符合第二范式的要求,并且非主属性之间不应存在传递依赖。换句话说,非主属性必须直接依赖于主键,而不能通过其他非主属性间接依赖。
示例: 假设有一个“员工”表,包含以下信息:
| 员工ID | 部门ID | 部门名称 |
|---|---|---|
| 1 | D01 | 销售部 |
| 2 | D02 | 市场部 |
| 3 | D01 | 销售部 |
在这个表中,部门名称依赖于部门ID,而部门ID又依赖于员工ID。这导致了传递依赖:部门名称通过部门ID间接依赖于员工ID。因此,该表不符合第三范式。
调整后:
可以将“员工”表分解为两个表,以消除传递依赖:
-
“员工信息”表,记录员工的基本信息:
员工ID 部门ID 1 D01 2 D02 3 D01 -
“部门信息”表,记录部门的详细信息:
部门ID 部门名称 D01 销售部 D02 市场部
这样,“部门名称”直接依赖于“部门ID”,不再通过“员工ID”传递依赖,符合了第三范式的要求。
为什么要遵循三范式?
遵循三范式可以带来以下优点:
- 减少数据冗余:通过拆分表格,将重复数据放置在不同的表中,减少存储的冗余。
- 提高数据一致性:由于消除了数据冗余,更新数据时可以避免重复修改,从而确保数据一致性。
- 便于维护:更规范的表结构使得数据管理更加简单,有助于数据库的维护和扩展。
然而,在某些特殊情况下,过度拆分表格可能会导致性能下降或查询复杂性增加。因此,数据库设计时也需要权衡范式的规范性与实际应用的性能需求。
总结
数据库的三范式帮助我们规范化数据表结构,减少冗余,提高数据的完整性和一致性。通常,遵循三范式的设计足以满足大多数应用场景的数据需求。理解并应用这些范式,有助于建立高效、可靠的数据库结构,为应用程序的数据管理提供强有力的支持。
相关文章:
深入理解数据库的三范式
数据库设计中的范式(Normal Form)是用于规范数据存储结构、消除冗余以及保证数据一致性的重要原则。范式的概念有多种层次,常用的前三种称为第一范式(1NF)、第二范式(2NF)和第三范式(…...
P11233 [CSP-S 2024] 染色
P11233 [CSP-S 2024] 染色 难度:提高/省选-。 考点:DP。 题意: 给定 n n n 个数 A i A_i Ai,对 A i A_i Ai 进行染色,只有两种颜色。设 C C C 为 A A A 染色后的数组。 如果 A i A_i Ai 左侧没有预期同…...
图传推流学习(敬请期待)
图传推流简介 1.RTSP、RTP与RTCP2.搭建rtsp服务器(资源下载)3.搭建rtsp服务器(搭建过程) 1.RTSP、RTP与RTCP RTSP(Real Time Streaming Protocol)、RTP(Real-time Transport Protocol࿰…...
【JavaGuide】十大经典排序算法总结
冒泡排序 算法步骤 不断的两两比较,这样当前最大的元素总是会排在最后面。所以称为冒泡。 图解算法 代码实现 public static int[] bubbleSort(int[] arr) {// i是排好了几个数for (int i 1; i < arr.length; i) {// flag标记当前循环是否调整了顺序,…...
程序中怎样用最简单方法实现写excel文档
很多开发语言都能找到excel文档读写的库,但是在资源极其受限的环境下开发,引入这些库会带来兼容性问题。因为一个小功能引入一堆库,我始终觉得划不来。看到有项目引用的jar包有一百多个,看着头麻,根本搞不清谁依赖谁。…...
《机器学习与人类学习:比较、融合与未来展望》
《机器学习与人类学习:比较、融合与未来展望》 一、引言二、机器学习的概念与发展(一)机器学习的定义与分类(二)机器学习的发展历程(三)机器学习的应用领域 三、人类学习的本质与过程࿰…...
Mysql 8.4.3LTS 的离线部署
文章目录 一、部署环境资源配置 二、下载地址版本选择 三、部署详情1. 上传安装包2. 解压软件包3. 安装mysql3.3.1 创建mysql用户与用户组3.3.2 授权安装文件夹3.3.3 安装libaio依赖 (坑)ubuntu24.04 中关于libaio的坑 3.3.4 初始化Mysql数据库3.3.5 编辑…...
h5项目打包上线报错404文件找不到
配置一下路由就可以了 1.找到项目里的这个文件 2.滑到最下面‘源码视图’ 3.找到base,没有的话写上一个,保存后打包就可以了 "h5" : {"router" : {"base" : "./"}}...
mysql上课总结(5)(MySQL的完整性约束(详细介绍))
目录 一、完整性约束。 (1)概念与目的。 <1>概念。 <2>目的。 (2)各个约束的详细(表格) (3)各个约束的简要总结。 <1>主键约束。 <2>唯一约束。 <3>非…...
复原IP地址
分割字符串的姐妹题 题目:93. 复原 IP 地址 - 力扣(LeetCode) 题解:代码随想录 代码: class Solution {List<String> resnew ArrayList<>();public List<String> restoreIpAddresses(String s) …...
Effective C++ 学习笔记二
Effective C 学习笔记二 文章目录 Effective C 学习笔记二别让异常逃离析构函数绝不在构造和析构的过程中调用virtual函数令operator 返回一个reference to *this在operator中处理"自我赋值"C四种转换 别让异常逃离析构函数 C 并不禁止析构函数吐出异常,…...
以「JIMUMETA元宇宙体验馆」为例,探讨有哪些元宇宙场景?
让我们以「JIMUMETA元宇宙体验馆」为例,深入探讨元宇宙场景中提供的产品与服务。该体验馆由视创云展精心打造,集成了企业主展馆、元宇宙虚拟活动分会场、品牌展示分会场、线上论坛会场以及会议室接待会客等多重功能,旨在全方位满足企业发布会…...
RHCE的练习(8)
动态网站 lnmp(LAMP) 解析index.php界面 (1)预配,确保服务能够被访问 systemctl stop firewalld setenforce 0 (2)安装nginx服务 mount /dev/sr0 /mnt cat /etc/yum.repos.d/base.repo dnf …...
yocto是如何收集recipes,如何加入现有的bb文件
yocto通常是如何收集recipes: 在Yocto中,通过以下方式收集recipes: 层(Layers) Yocto项目使用层来组织recipes。层是包含配置文件、recipes和其他相关文件的目录结构。每个层有自己的目录,其中 recipes-* 目录用于存…...
[运维] 服务器本地网络可用性检查脚本
引言 在日常活动中,我遇到过一个令人头疼的问题。测试使用的远程终端在第二天继续使用时可能就发生无法与外网通信的情况,往往连上终端后在拉取资源时才能发现。这导致每次使用前都需要手动检查网络状况,增加了不必要的麻烦。为了简化这一过…...
MYSQL-显示信息关于服务器插件语法(二十五)
13.7.5.25 SHOW PLUGINS 语句 SHOW PLUGINSSHOW PLUGINS 显示信息 关于服务器插件。 SHOW PLUGINS 输出示例: mysql> SHOW PLUGINS\G *************************** 1. row ***************************Name: binlogStatus: ACTIVEType: STORAGE ENGINE Librar…...
【线下培训】龙信受邀参加开封市公安局举办的电子数据取证培训班
文章关键词:电子数据取证、手机取证、云取证、国产化取证 为了提升开封市公安机关在互联网电子数据取证分析方面的专业能力,龙信为开封市公安机关量身打造了一场高质量的电子数据取证分析技能培训课程。 本次培训课程不仅涵盖了电子数据取证的基础理论、…...
软件测试工程师面试整理 —— 编程与自动化!
在软件测试领域,编程与自动化是提升测试效率、覆盖率和可靠性的关键因素。掌握编程技术和自动化测试框架,能够帮助测试人员有效地执行大量重复性测试任务,并迅速反馈软件的质量状况。以下是编程与自动化在测试中的主要应用及相关技术介绍&…...
【鸿蒙新闻】10月29日警用鸿蒙开发者大会在北京胜利召开,开启智慧应用新时代!
10月29日,在公安部科技信息化局、公安部装备财务局指导下,由公安部第一研究所主办,鼎桥通信技术有限公司、OpenHarmony生态委员会及公共安全专委会协办的警用鸿蒙开发者大会在北京胜利召开。会议以“拥抱警鸿创新生态 开启智慧应用新时代”为…...
java.io.IOException: Too many open files
java.io.IOException: Too many open files 前言: 项目最近报 java.io.IOException: Too many open files 问题,大概意思是:意味着你的应用程序尝试打开的文件描述符数量超过了系统允许的最大数量,在linux中每个进程打开的文件描…...
未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?
编辑:陈萍萍的公主一点人工一点智能 未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战,在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…...
【力扣数据库知识手册笔记】索引
索引 索引的优缺点 优点1. 通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性。2. 可以加快数据的检索速度(创建索引的主要原因)。3. 可以加速表和表之间的连接,实现数据的参考完整性。4. 可以在查询过程中,…...
Redis相关知识总结(缓存雪崩,缓存穿透,缓存击穿,Redis实现分布式锁,如何保持数据库和缓存一致)
文章目录 1.什么是Redis?2.为什么要使用redis作为mysql的缓存?3.什么是缓存雪崩、缓存穿透、缓存击穿?3.1缓存雪崩3.1.1 大量缓存同时过期3.1.2 Redis宕机 3.2 缓存击穿3.3 缓存穿透3.4 总结 4. 数据库和缓存如何保持一致性5. Redis实现分布式…...
java 实现excel文件转pdf | 无水印 | 无限制
文章目录 目录 文章目录 前言 1.项目远程仓库配置 2.pom文件引入相关依赖 3.代码破解 二、Excel转PDF 1.代码实现 2.Aspose.License.xml 授权文件 总结 前言 java处理excel转pdf一直没找到什么好用的免费jar包工具,自己手写的难度,恐怕高级程序员花费一年的事件,也…...
C++八股 —— 单例模式
文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念 线程安全(Thread Safety) 线程安全是指在多线程环境下,某个函数、类或代码片段能够被多个线程同时调用时,仍能保证数据的一致性和逻辑的正确性…...
Proxmox Mail Gateway安装指南:从零开始配置高效邮件过滤系统
💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「storms…...
面试高频问题
文章目录 🚀 消息队列核心技术揭秘:从入门到秒杀面试官1️⃣ Kafka为何能"吞云吐雾"?性能背后的秘密1.1 顺序写入与零拷贝:性能的双引擎1.2 分区并行:数据的"八车道高速公路"1.3 页缓存与批量处理…...
WEB3全栈开发——面试专业技能点P4数据库
一、mysql2 原生驱动及其连接机制 概念介绍 mysql2 是 Node.js 环境中广泛使用的 MySQL 客户端库,基于 mysql 库改进而来,具有更好的性能、Promise 支持、流式查询、二进制数据处理能力等。 主要特点: 支持 Promise / async-await…...
Linux操作系统共享Windows操作系统的文件
目录 一、共享文件 二、挂载 一、共享文件 点击虚拟机选项-设置 点击选项,设置文件夹共享为总是启用,点击添加,可添加需要共享的文件夹 查询是否共享成功 ls /mnt/hgfs 如果显示Download(这是我共享的文件夹)&…...
【PX4飞控】mavros gps相关话题分析,经纬度海拔获取方法,卫星数锁定状态获取方法
使用 ROS1-Noetic 和 mavros v1.20.1, 携带经纬度海拔的话题主要有三个: /mavros/global_position/raw/fix/mavros/gpsstatus/gps1/raw/mavros/global_position/global 查看 mavros 源码,来分析他们的发布过程。发现前两个话题都对应了同一…...
