当前位置: 首页 > article >正文

【数据库基础】正则化(Normalization)P1:从UNF到3NF的渐进式优化指南

1. 为什么需要数据库正则化第一次设计数据库表结构时很多人会犯一个典型错误——把所有数据都塞进一个大表里。比如做一个租房管理系统可能会设计包含客户信息、房源信息、租赁记录、业主信息的大杂烩表格。这种设计短期内看似方便但随着数据量增长问题会逐渐暴露数据冗余严重同一个客户的姓名可能在几百条记录中重复出现更新异常修改业主电话需要更新成千上万条记录插入困难新房源没有租赁记录时无法录入业主信息删除风险删除租赁记录可能连带删除唯一的房源信息我在早期项目中就踩过这种坑。当时做一个电商系统订单表里直接嵌入了完整的客户信息和商品详情。结果运营半年后每次修改商品价格都需要扫描上百万条历史订单系统慢得根本没法用。正则化就是解决这些问题的系统方法。它通过渐进式拆分将大表分解为多个结构清晰的小表每个表只关注一件事。这种设计虽然查询时需要多表连接但带来的优势是决定性的存储空间减少40%-60%实测结果更新操作只需修改单条记录避免插入/删除时的连带影响数据结构更易于理解和维护2. 从UNF到1NF原子性改造2.1 认识无范式(UNF)结构无范式(Unnormalized Form)就像刚收集完需求的原始数据。以客户租赁表为例clientNoclientNamepropertyNopAddressrentStartrentFinishownerNooNameCR76JohnPG4,PG16London1-Jul-2031-Aug-20CO40,CO93Tina,Tim这种结构的典型特征单个单元格存储多个值PG4,PG16混合实体类型客户房源租赁业主没有明确的主键约束2.2 1NF转换实战第一范式(1NF)的核心要求是原子性每个单元格只能包含单一值。转换时需要展开多值字段将包含多个值的单元格拆分为多行识别复合主键通常需要多个字段才能唯一标识记录-- 转换后的1NF表结构示例 CREATE TABLE ClientRental_1NF ( clientNo VARCHAR(5), clientName VARCHAR(20), propertyNo VARCHAR(5), pAddress VARCHAR(50), rentStart DATE, rentFinish DATE, ownerNo VARCHAR(5), oName VARCHAR(20), PRIMARY KEY (clientNo, propertyNo, rentStart) ); -- 拆分后的数据示例 INSERT INTO ClientRental_1NF VALUES (CR76,John,PG4,London,1-Jul-20,31-Aug-20,CO40,Tina), (CR76,John,PG16,London,1-Jul-20,31-Aug-20,CO93,Tim);实际项目中要注意确保拆分后的记录能通过复合主键唯一标识对于日期范围等复杂数据需要评估是否应该进一步拆分文本字段中的逗号分隔值要特别处理如北京,上海3. 从1NF到2NF消除部分依赖3.1 函数依赖详解第二范式(2NF)要求消除非主键属性对主键的部分依赖。先理解几个关键概念函数依赖如果知道A的值就能确定B的值记作A→B员工号→部门号一个员工只属于一个部门(学号,课程号)→成绩需要两者组合才能确定成绩完全依赖非主键属性需要依赖整个主键(学号,课程号)→成绩完全依赖部分依赖非主键属性只需依赖部分主键(学号,课程号)→学生姓名实际只依赖学号3.2 2NF转换步骤以租赁系统为例分析1NF表存在的函数依赖识别候选键(clientNo, propertyNo, rentStart)(clientNo, propertyNo, rentFinish)(propertyNo, rentStart, rentFinish)发现部分依赖clientNo → clientNamepropertyNo → pAddress, ownerNo, oName转换操作-- 拆分为三个表 CREATE TABLE Client ( clientNo VARCHAR(5) PRIMARY KEY, clientName VARCHAR(20) ); CREATE TABLE Property ( propertyNo VARCHAR(5) PRIMARY KEY, pAddress VARCHAR(50), ownerNo VARCHAR(5), oName VARCHAR(20) ); CREATE TABLE Rental ( clientNo VARCHAR(5), propertyNo VARCHAR(5), rentStart DATE, rentFinish DATE, PRIMARY KEY (clientNo, propertyNo, rentStart), FOREIGN KEY (clientNo) REFERENCES Client(clientNo), FOREIGN KEY (propertyNo) REFERENCES Property(propertyNo) );实际应用建议使用数据库设计工具可视化函数依赖如MySQL Workbench对于大型表可以先导出样本数据到Excel分析依赖关系注意外键约束的设置确保数据完整性4. 从2NF到3NF消除传递依赖4.1 传递依赖的本质第三范式(3NF)要解决的是间接依赖问题。当存在A→B→C的链式依赖时即使满足2NF仍会产生更新异常修改业主姓名需要更新所有相关房源插入限制新增业主必须有房源记录删除风险删除最后一条房源会丢失业主信息典型案例propertyNo → ownerNo → oName订单号 → 客户ID → 客户地址学生ID → 导师ID → 导师职称4.2 3NF转换实战继续改造之前的Property表识别传递依赖propertyNo → ownerNo → oName拆分步骤创建独立的Owner表Property表只保留ownerNo作为外键-- 最终3NF结构 CREATE TABLE Owner ( ownerNo VARCHAR(5) PRIMARY KEY, oName VARCHAR(20) ); CREATE TABLE Property_3NF ( propertyNo VARCHAR(5) PRIMARY KEY, pAddress VARCHAR(50), ownerNo VARCHAR(5), FOREIGN KEY (ownerNo) REFERENCES Owner(ownerNo) );性能考量多表连接确实会增加查询复杂度合理使用索引可以弥补性能损失对于极少更新的表可以适当冗余提高查询效率5. 正则化实践建议在实际项目中应用正则化时有几个经验值得分享不要过度正则化达到3NF通常足够更高级范式(BCNF/4NF)只在特定场景需要性能平衡对于报表类高频查询可以适当保留冗余渐进式改进不要试图一次性完成所有正则化工具辅助使用SQL Power Architect等工具可视化依赖关系文档记录维护数据字典说明每个表的设计理由我曾经参与过一个医疗系统改造项目原始数据库有200多个字段的超级大表。通过渐进式正则化数据库大小从120GB缩减到45GB更新操作速度提升8倍复杂查询性能提高3-5倍关键是要理解每个范式解决的具体问题而不是机械地套用规则。好的数据库设计应该像乐高积木——每个模块简单独立但能灵活组合出各种结构。

相关文章:

【数据库基础】正则化(Normalization)P1:从UNF到3NF的渐进式优化指南

1. 为什么需要数据库正则化? 第一次设计数据库表结构时,很多人会犯一个典型错误——把所有数据都塞进一个大表里。比如做一个租房管理系统,可能会设计包含客户信息、房源信息、租赁记录、业主信息的大杂烩表格。这种设计短期内看似方便&#…...

使用钉钉远程操作你的claude code寺

先回顾:三次握手(建立连接)核心流程(实际版) 为了让挥手流程衔接更顺畅,咱们先快速回顾三次握手的实际核心,避免上下文脱节: 第一步(客户端→服务器)&#xf…...

[AI/向量数据库/GUI] Attu : Milvus 的图形化与一体化管理工具捞

前言 在使用 kubectl get $KIND -o yaml 查看 k8s 资源时,输出结果中包含大量由集群自动生成的元数据(如 managedFields、resourceVersion、uid 等)。这些信息在实际复用 yaml 清单时需要手动清理,增加了额外的工作量。 使用 kube…...

Phi-4-reasoning-vision-15B部署案例:开箱即用Web界面,免配置跑通文档OCR问答

Phi-4-reasoning-vision-15B部署案例:开箱即用Web界面,免配置跑通文档OCR问答 1. 模型介绍 Phi-4-reasoning-vision-15B是微软推出的视觉多模态推理模型,专为处理复杂视觉任务而设计。这个模型最厉害的地方在于,它能像人类一样&…...

Veo 3.1 AI 视频生成 + 字幕叠加完整实战指南

通过 GCP Vertex AI Veo 3.1 生成短视频,结合 Python moviepy 自动叠加字幕,实现从脚本到成品视频的全自动化流程,适用于 AI 短视频批量生产。 说明:本文基于实际视频生成项目整理,涵盖 Veo 3.1 异步调用、提示词工程、字幕叠加和批量生产方案,去除敏感信息后形成通用化指…...

若依框架+MQTT实战:5步搞定物联网设备数据实时入库(附避坑指南)

若依框架与MQTT深度整合:物联网设备数据实时落库实战指南 1. 技术选型与架构设计 在物联网应用开发中,实时数据传输与处理是核心需求。我们采用若依(RuoYi)框架作为基础架构,结合MQTT协议实现设备数据的高效采集与存储,这种组合…...

AI浪潮下的零售本质:选对品、摆对位、补对货、管好店 | 数图邀您杭州共修“基本功”

零售圈的朋友们,好久不见。距离我们在深圳的约定,转眼已近一年。彼时,数图展台前的每一次驻足与探讨,都让我们坚信:无论技术如何更迭,零售人对“练好基本功”的渴求,从未改变。4月15日-17日&…...

Stable Diffusion像素化创新:Pixel Fashion Atelier对复古RPG UI的现代化重构

Stable Diffusion像素化创新:Pixel Fashion Atelier对复古RPG UI的现代化重构 1. 项目概述 Pixel Fashion Atelier(像素时装锻造坊)是一款基于Stable Diffusion与Anything-v5的图像生成工作站。它将传统AI工具的实用功能与复古日系RPG的视觉…...

告别手动排版!用Zotero插件在Word中一键生成标准参考文献(含会议论文特殊处理)

学术写作效率革命:ZoteroWord全自动参考文献解决方案 在学术写作的漫长马拉松中,参考文献格式调整往往是最消耗精力的"最后一公里"。我曾亲眼目睹一位博士生在论文截稿前夜,手动调整了237条参考文献的标点符号和作者格式——这种场…...

OpenClaw 大结局——接入个人微信诤

本课概览 Microsoft Agent Framework (MAF) 提供了一套强大的 Workflow(工作流) 框架,用于编排和协调多个智能体(Agent)或处理组件的执行流程。 本课将以通俗易懂的方式,帮助你理解 MAF Workflow 的核心概念…...

M5-SX127x:面向ESP32的轻量级LoRa驱动库

1. 项目概述M5-SX127x 是一款专为 M5Stack 硬件平台设计的 SX127x 系列 LoRa 射频模块驱动库,其核心目标是为基于 ESP32 主控的 M5Stack 系列开发板(如 M5Stack Core、Core2、Atom Echo 等)提供轻量、可靠、可移植的 LoRa 物理层通信能力。该…...

AI理论能力或吞噬美国就业市场?真相并非如此

AI理论上能完成超80%工作任务,就业市场要变天?本月,Anthropic发布的关于人工智能对劳动力市场影响的报告中一张图表广为流传。它对比了22个职业类别中,当前职业对大语言模型(LLM)的“实际接触程度”和这些L…...

告别一人一链!微信URL Scheme新规详解:如何让同一个链接被千万用户访问

微信URL Scheme新规实战指南:如何设计高并发跳转架构 去年底微信团队对URL Scheme规则的调整,像一场及时雨浇灭了营销活动中的技术焦虑。记得去年双十一前夜,我们团队为了给H5活动页配置小程序跳转链接,不得不连夜生成数百万条独立…...

D3KeyHelper终极指南:暗黑3技能自动化与辅助功能完全解析

D3KeyHelper终极指南:暗黑3技能自动化与辅助功能完全解析 【免费下载链接】D3keyHelper D3KeyHelper是一个有图形界面,可自定义配置的暗黑3鼠标宏工具。 项目地址: https://gitcode.com/gh_mirrors/d3/D3keyHelper D3KeyHelper是一款专为《暗黑破…...

OFA与LangChain集成:构建智能图文问答系统

OFA与LangChain集成:构建智能图文问答系统 用AI看懂图片并回答你的问题,原来这么简单 你有没有遇到过这样的情况:看到一张复杂的图表,却不知道它在表达什么;或者收到一张产品图片,但找不到相关的说明文档。…...

VS2015环境下FreeImage库的安装与配置全攻略(含常见问题解决)

VS2015环境下FreeImage库的完整配置指南与实战技巧 在Windows平台进行图像处理开发时,选择合适的图像处理库往往能事半功倍。FreeImage作为一款轻量级但功能强大的开源库,支持超过20种常见图像格式,从BMP、JPEG到专业的TIFF格式都能轻松应对。…...

从湖北师大真题看C语言核心考点:循环、递归、数组实战避坑指南

从湖北师大真题看C语言核心考点:循环、递归、数组实战避坑指南 在C语言的学习过程中,真题练习是检验和提升编程能力的重要途径。湖北师范大学的专升本编程真题涵盖了循环、递归、数组等核心知识点,这些不仅是考试的重点,更是实际开…...

Qwen3.5-4B-Claude-Opus详细步骤:修改系统提示词打造专属AI助教方法

Qwen3.5-4B-Claude-Opus详细步骤:修改系统提示词打造专属AI助教方法 1. 理解模型特性 1.1 模型基础介绍 Qwen3.5-4B-Claude-4.6-Opus-Reasoning-Distilled-GGUF是一个基于Qwen3.5-4B的推理蒸馏模型,特别强化了结构化分析、分步骤回答、代码与逻辑类问…...

源码级交付的低代码革命:基于 Spring Boot 的 AI 视频中台二次开发实战

引言:从“项目定制”到“产品化”的跨越之痛 作为一名在安防行业摸爬滚打多年的架构师,我深知行业内的一个悖论:客户想要的是“开箱即用”的成熟产品,而现实场景却要求“千企千面”的深度定制。传统的开发模式下,为了满…...

第三十三课:LIF神经元模型与SpikingJelly实战解析

1. LIF神经元模型:从生物启发的数学原理说起 第一次看到LIF(Leaky Integrate-and-Fire)神经元时,我脑海中浮现的是中学物理课上那个总在漏电的电容器。这种神经元模型之所以被称为"漏电积分放电",正是因为它…...

Claude Code与Kimi跨平台部署及API调优实战

1. Claude Code与Kimi跨平台部署指南 最近在折腾AI编程助手时,我发现Claude Code和Kimi这两个工具搭配使用效果出奇的好。作为一个经常在不同操作系统间切换的开发者,我花了两周时间把Windows、macOS和Linux三个平台的部署都摸了个遍,今天就把…...

百元挂耳式耳机哪款音质好?带你弄懂最值得购买的十大开放式耳机

现在市面上有些牌子,价格标得挺高,体验却跟不上;还有些走低价路线的网红款,看着参数漂亮,实际到手一用——耳挂硬得硌耳朵,声音飘得像隔层纱,用不了几个月就开始出毛病。这种产品,买…...

FISCO BCOS 日常操作使用托管签名服务(如WeBASE-Sign),业务系统不直接接触私钥

实战:如何通过WeBASE-Sign实现私钥托管与安全签名 目录 引言 一、为什么需要签名分离 1.1 传统签名的安全困境 1.2 签名分离的架构优势 1.3 适用场景 二、WeBASE-Sign 签名服务核心原理 2.1 整体架构 2.2 核心接口 2.3 交易流程中的签名位置 三、实战:完整接入流程…...

从一次生产事故复盘说起:我们是如何用JProfiler为Spring Boot应用节省了40%内存的

从一次生产事故复盘说起:我们是如何用JProfiler为Spring Boot应用节省了40%内存的 那是一个周五的深夜,报警短信突然炸响了整个技术群的手机——核心订单服务在流量高峰时段连续触发OOM崩溃,自动重启后仅维持20分钟又再次宕机。运维团队被迫将…...

VL53L0X ToF测距模块Arduino驱动详解

1. 项目概述Deneyap Derinlik ler,即 Deneyap ToF Range Finder Sensor,是一款基于 STMicroelectronics VL53L0X 飞行时间(Time-of-Flight, ToF)测距传感器的 Arduino 兼容硬件模块。该模块专为土耳其 Deneyap 教育生态设计&#…...

SITS2026踩坑实录:47个生产环境AI推理延迟突增案例,含GPU调度错配、时序特征漂移检测及央行《智能风控接口规范》映射表

第一章:SITS2026案例:AI原生金融系统改造 2026奇点智能技术大会(https://ml-summit.org) 在2026年全球金融基础设施升级浪潮中,新加坡国际交易结算系统(SITS)启动代号为“Project Aether”的AI原生重构工程。该项目摒…...

什么年代了怎么还在用bash啊?现代化shell开箱体验: fish, nu, elvish口

整体排查思路 我们的目标是验证以下三个环节是否正常: 登录成功时:服务器是否正确生成了Session并返回了包含正确 JSESSIONID的Cookie给浏览器。 浏览器端:浏览器是否成功接收并存储了该Cookie。 后续请求:浏览器在执行查询等操作…...

数控自学常用的几个网站,建议收藏

CNC自学网 网址:https://www.cnczxw.com 老机械工程师的点评:这网站是块硬料,专搞数控的,从基础操作到高级编程都给你掰扯明白。教程实在,没那些花里胡哨的玩意儿,适合踏踏实实学手艺的。 我要自学网 网…...

2026奇点大会闭门报告首发(仅限首批200名工程负责人):AI原生测试的7层抽象架构与4类不可逆迁移陷阱

第一章:2026奇点智能技术大会:AI原生测试自动化 2026奇点智能技术大会(https://ml-summit.org) 在2026奇点智能技术大会上,“AI原生测试自动化”不再是一个愿景,而是已落地的工程范式——它将大语言模型、多模态推理与测试生命周…...

SIwave TDR仿真实战:从模型导入到阻抗结果深度解析

1. SIwave TDR仿真基础与实战价值 TDR(时域反射计)仿真是高速电路设计中不可或缺的验证手段。我第一次接触SIwave的TDR功能是在一个10Gbps SerDes链路项目中,当时遇到了信号完整性问题却苦于找不到准确的阻抗突变点。传统频域仿真虽然能给出S…...