当前位置: 首页 > article >正文

PostgreSQL:语言基础与数据库操作

🧑 博主简介:CSDN博客专家历代文学网(PC端可以访问:https://literature.sinhy.com/#/?__c=1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编程高并发设计Springboot和微服务,熟悉LinuxESXI虚拟化以及云原生Docker和K8s,热衷于探索科技的边界,并将理论知识转化为实际应用。保持对新技术的好奇心,乐于分享所学,希望通过我的实践经历和见解,启发他人的创新思维。在这里,我希望能与志同道合的朋友交流探讨,共同进步,一起在技术的世界里不断学习成长。
技术合作请加本人wx(注明来自csdn):foreast_sea

在这里插入图片描述


在这里插入图片描述

PostgreSQL:语言基础与数据库操作

引言

在当今数据驱动的数字世界中,数据库技术如同现代城市的交通网络,承载着海量数据的流动与存储。作为企业级开源数据库的标杆,PostgreSQL凭借其强大的扩展性、严格的ACID特性和丰富的功能集,已经成为支撑现代应用的基石。根据2023年DB-Engines排名统计,PostgreSQL连续五年蝉联"年度数据库"称号,其市场份额增长率高达36.7%,远超其他关系型数据库。

但真正掌握PostgreSQL的奥秘远不止于简单的CRUD操作。许多开发者在数据库设计初期往往忽视模式(Schema) 的规划,导致后期面临数据冗余查询性能低下等问题。就像建筑师需要精确的蓝图才能建造摩天大楼,数据库工程师必须深入理解模式的组织原则。在电商系统的典型场景中,不合理的模式设计可能使订单表与用户表产生循环依赖,或在促销活动期间因缺乏有效约束导致数据异常。

本文将以PostgreSQL 15为基准版本(2023年1月发布),深入剖析从模式设计到复杂查询优化的全链路实践。我们将通过一个在线教育平台的数据库设计案例,演示如何利用检查约束保证课程价格的合理性,使用物化视图加速复杂的报表查询,以及通过CTE(公共表表达式) 优化多层嵌套查询。所有代码示例均经过PG15环境实测验证,确保开发者可直接应用于生产环境。

1. 数据库与模式(Schema)的创建与管理

1.1 数据库的生命周期管理

-- 创建支持中文的数据库
CREATE DATABASE edu_platform ENCODING 'UTF8' LC_COLLATE 'zh_CN.utf8' LC_CTYPE 'zh_CN.utf8'TEMPLATE template0;-- 查看数据库属性
SELECT datname, encoding, datcollate 
FROM pg_database 
WHERE datname = 'edu_platform';-- 安全删除数据库(确保无活跃连接)
SELECT pg_terminate_backend(pid) 
FROM pg_stat_activity 
WHERE datname = 'edu_platform';DROP DATABASE IF EXISTS edu_platform;

1.2 模式的战略布局

-- 创建核心业务模式
CREATE SCHEMA course_management AUTHORIZATION dba_adminCREATE ROLE instructor;-- 修改模式所有权
ALTER SCHEMA course_management OWNER TO platform_admin;-- 跨模式搜索路径优化
SET search_path TO course_management, public;-- 查看模式权限
SELECT nspname, rolname AS owner 
FROM pg_namespace 
JOIN pg_roles ON (pg_namespace.nspowner = pg_roles.oid);

1.3 模式迁移策略

-- 使用扩展实现模式版本控制
CREATE EXTENSION pg_tle;  -- Trusted Language Extension-- 创建模式变更记录表
CREATE TABLE schema_migrations (version BIGINT PRIMARY KEY,description TEXT NOT NULL,applied_at TIMESTAMPTZ DEFAULT NOW()
);-- 典型迁移文件示例(V202307__add_course_schedule.sql)
BEGIN;
ALTER TABLE courses ADD COLUMN schedule JSONB;
CREATE INDEX idx_course_schedule ON courses USING GIN (schedule);
INSERT INTO schema_migrations VALUES (202307, 'Add course schedule');
COMMIT;

2. 表操作:结构设计的艺术

2.1 表创建进阶技巧

-- 包含分区和存储参数的表设计
CREATE TABLE course_enrollments (enrollment_id BIGINT GENERATED ALWAYS AS IDENTITY,user_id BIGINT NOT NULL,course_id INTEGER NOT NULL,enrolled_at TIMESTAMPTZ NOT NULL DEFAULT NOW(),progress NUMERIC(5,2) CHECK (progress BETWEEN 0 AND 100),CONSTRAINT pk_enrollment PRIMARY KEY (enrollment_id)
) PARTITION BY RANGE (enrolled_at)
WITH (autovacuum_enabled = true,fillfactor = 80
);-- JSONB与全文检索结合
CREATE TABLE course_contents (content_id UUID DEFAULT gen_random_uuid(),course_id INTEGER NOT NULL,metadata JSONB NOT NULL,search_vector tsvector GENERATED ALWAYS AS (to_tsvector('english', coalesce(metadata->>'title','') || ' ' ||coalesce(metadata->>'description',''))STORED,PRIMARY KEY (content_id)
);CREATE INDEX idx_content_search ON course_contents USING GIN (search_vector);

2.2 表结构演进策略

-- 零停机时间变更示例
BEGIN;
ALTER TABLE users ADD COLUMN IF NOT EXISTS mfa_enabled BOOLEAN DEFAULT false;
ALTER TABLE users ALTER COLUMN email SET DATA TYPE VARCHAR(320);
CREATE INDEX CONCURRENTLY idx_user_active ON users(id) WHERE is_active;
COMMIT;-- 复杂列修改(使用 USING 表达式)
ALTER TABLE course_reviews 
ALTER COLUMN rating TYPE SMALLINT 
USING CASE WHEN rating BETWEEN 1 AND 5 THEN rating::SMALLINTELSE NULL 
END;

3. CRUD操作:性能与安全的平衡

3.1 高效插入策略

-- 批量插入优化
INSERT INTO course_modules (course_id, module_title, duration)
SELECT course_id, title || ' Module', duration * 1.2
FROM draft_courses
WHERE status = 'approved'
ON CONFLICT (course_id, module_title) 
DO UPDATE SET duration = EXCLUDED.duration;-- 使用COPY命令加载数据
COPY student_profiles (user_id, bio, expertise_area)
FROM PROGRAM 'curl https://data-source/students.csv'
WITH (FORMAT csv, HEADER true);

3.2 智能查询优化

-- 窗口函数应用
SELECT course_id,AVG(rating) OVER (PARTITION BY course_id) AS avg_rating,PERCENT_RANK() OVER (ORDER BY enrollment_count DESC) AS popularity_rank
FROM (SELECT c.course_id, COUNT(e.enrollment_id) AS enrollment_count,AVG(r.rating) AS ratingFROM courses cLEFT JOIN course_enrollments e USING (course_id)LEFT JOIN course_reviews r USING (course_id)GROUP BY c.course_id
) AS course_stats;-- JSONB路径查询
SELECT content_id, metadata->'author'->>'name' AS author_name,metadata #> '{sections, 0, duration}' AS first_section_duration
FROM course_contents
WHERE metadata @> '{"tags": ["programming"]}';

4. 约束:数据完整性的守护者

4.1 高级约束技术

-- 排除约束(防止时间重叠)
CREATE TABLE course_schedules (course_id INTEGER NOT NULL,schedule_range TSTZRANGE,EXCLUDE USING GIST (course_id WITH =,schedule_range WITH &&)
);-- 自定义域类型约束
CREATE DOMAIN course_price AS NUMERIC(10,2)
CHECK (VALUE BETWEEN 0 AND 10000 AND VALUE % 5 = 0  -- 价格必须是5的倍数
);CREATE TABLE courses (price course_price NOT NULL
);

5. 视图与临时表:灵活的数据视角

5.1 物化视图优化

-- 自动刷新物化视图
CREATE MATERIALIZED VIEW course_statistics
AS
SELECT c.course_id,COUNT(e.enrollment_id) AS total_enrollments,AVG(r.rating) AS average_rating
FROM courses c
LEFT JOIN course_enrollments e USING (course_id)
LEFT JOIN course_reviews r USING (course_id)
GROUP BY c.course_id
WITH DATA;-- 使用pg_cron定时刷新
SELECT cron.schedule('refresh-course-stats', '0 3 * * *', $$REFRESH MATERIALIZED VIEW CONCURRENTLY course_statistics$$);

5.2 临时表实战应用

-- 事务级临时表处理复杂ETL
BEGIN;
CREATE TEMP TABLE temp_user_analysis ON COMMIT DROP AS
SELECT user_id,SUM(CASE WHEN progress = 100 THEN 1 ELSE 0 END) AS completed_courses,AVG(progress) FILTER (WHERE progress > 0) AS avg_progress
FROM course_enrollments
GROUP BY user_id;EXPLAIN ANALYZE 
SELECT * FROM temp_user_analysis 
WHERE completed_courses > 5;
COMMIT;

结语:持续演进的数据库艺术

PostgreSQL 15的新特性如MERGE命令、JSON_OBJECT构造函数等,正在不断扩展其应用边界。建议开发者关注以下前沿方向:

  1. 向量相似度搜索:结合pgvector扩展实现AI特征检索
  2. 分布式架构:使用Citus实现水平扩展
  3. 时序数据优化:TimescaleDB的深度集成
  4. 机器学习集成:MADlib库的统计分析应用

参考文献

  1. PostgreSQL Global Development Group. (2023). PostgreSQL 15 Documentation. https://www.postgresql.org/docs/15/
  2. Riggs, S. et al. (2022). PostgreSQL 14 Administration Cookbook. Packt Publishing
  3. Ants Aasma. (2023). Deep Dive into PostgreSQL Indexing. PGConf.EU
  4. Hironobu Suzuki. (2021). The Internals of PostgreSQL. ISBN 978-1-098-09290-0
  5. AWS Database Blog. (2023). Best Practices for Schema Design in Amazon Aurora PostgreSQL

相关文章:

PostgreSQL:语言基础与数据库操作

🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编…...

RK3568 Android11 sh366006驱动

sh366006.c /* 谁愿压抑心中怒愤冲动咒骂这虚与伪与假从没信要屈膝面对生命纵没有别人帮一生只靠我双手让我放声疯狂叫囔今天的他 呼风可改雨不可一世太嚣张 --《不可一世》Beyond */ #include <linux/module.h> #include <linux/init.h> #include <linux/fs.h…...

蓝桥杯学习——二叉树+奇点杯题目解析

基础认知 一、二叉树种类&#xff1a; 1.满二叉树。记深度k&#xff0c;节点数量2^k-1。 2.完全二叉树&#xff1a;除了底层&#xff0c;其余全满&#xff0c;底部从左到右连续。 3&#xff0c;平衡二叉搜索树&#xff1a;左子树和右子树高度差不大于1。 二、存储方式&…...

基于django+vue的购物商城系统

开发语言&#xff1a;Python框架&#xff1a;djangoPython版本&#xff1a;python3.8数据库&#xff1a;mysql 5.7数据库工具&#xff1a;Navicat11开发软件&#xff1a;PyCharm 系统展示 系统首页 热卖商品 优惠资讯 个人中心 后台登录 管理员功能界面 用户管理 商品分类管理…...

AI安全、大模型安全研究(DeepSeek)

DeepSeek 点燃AI应用革命之火,但安全 “灰犀牛” 正在逼近 DeepSeek-R1国产大模型的发布,以技术创新惊艳了全球,更是极致的性价比推动国内千行百业接入 AI,政府、企业竞速开发智能业务处理、智能客服、代码生成、营销文案等应用,“落地效率” 成为第一关键词。然而与此相…...

卷积神经网络 - 汇聚层

卷积神经网络一般由卷积层、汇聚层和全连接层构成&#xff0c;本文我们来学习汇聚层。 汇聚层(Pooling Layer)也叫子采样层(Subsampling Layer)&#xff0c;其作用是进 行特征选择&#xff0c;降低特征数量&#xff0c;从而减少参数数量。 卷积层虽然可以显著减少网络中连接的…...

蓝桥杯备赛-贪心-管道

问题描述 有一根长度为 lenlen 的横向的管道&#xff0c;该管道按照单位长度分为 lenlen 段&#xff0c;每一段的中央有一个可开关的阀门和一个检测水流的传感器。 一开始管道是空的&#xff0c;位于 LiLi​ 的阀门会在 SiSi​ 时刻打开&#xff0c;并不断让水流入管道。 对…...

论文分享:PL-ALF框架实现无人机低纹理环境自主飞行

在室内仓库、地下隧道等低纹理复杂场景中&#xff0c;无人机依赖视觉传感器进行自主飞行时&#xff0c;往往会遇到定位精度低、路径规划不稳定等难题。针对这一问题&#xff0c;重庆邮电大学计算机学院雷大江教授团队在IEEE Trans期刊上提出了一种新型自主飞行框架&#xff1a;…...

Nodejs使用redis

框架&#xff1a;koa&#xff0c;通过koa-generator创建 redis: 本地搭建&#xff0c;使用默认帐号&#xff0c;安装说明地址以及默认启动设置&#xff1a;https://redis.io/docs/latest/operate/oss_and_stack/install/install-redis/install-redis-on-linux/ 中间件&#x…...

GitHub 超火的开源终端工具——Warp

Warp 作为近年来 GitHub 上备受瞩目的开源终端工具&#xff0c;以其智能化、高性能和协作能力重新定义了命令行操作体验。以下从多个维度深入解析其核心特性、技术架构、用户评价及生态影响力&#xff1a; 一、背景与核心团队 Warp 由前 GitHub CTO Jason Warner 和 Google 前…...

计算机视觉技术探索:美颜SDK如何利用深度学习优化美颜、滤镜功能?

时下&#xff0c;计算机视觉深度学习正在重塑美颜技术&#xff0c;通过智能人脸检测、AI滤镜、深度美肤、实时优化等方式&#xff0c;让美颜效果更加自然、精准、个性化。 那么&#xff0c;美颜SDK如何结合深度学习来优化美颜和滤镜功能&#xff1f;本文将深入解析AI在美颜技术…...

应用商店上新:Couchbase Enterprise Server集群

可移植的冗余数据平台&#xff0c;这往往是创建可扩展的云原生应用程序的先决条件。而不依赖特定平台的工具可用于为多云、多区域工作负载提供企业级应用所需的灵活性。 ​Couchbase是一种高性能NoSQL数据库&#xff0c;专为当今复杂的云生态系统所需的动态扩展能力而设计。最近…...

Redis解决缓存击穿问题——两种方法

目录 引言 解决办法 互斥锁&#xff08;强一致&#xff0c;性能差&#xff09; 逻辑过期&#xff08;高可用&#xff0c;性能优&#xff09; 设计逻辑过期时间 引言 缓存击穿&#xff1a;给某一个key设置了过期时间&#xff0c;当key过期的时候&#xff0c;恰好这个时间点对…...

前端 Blob 详解

前端 Blob 详解 1. 什么是 Blob&#xff1f; Blob&#xff08;Binary Large Object&#xff09;表示二进制大对象&#xff0c;用于存储二进制数据。在前端开发中&#xff0c;Blob 常用于处理文件、图像、视频等二进制数据。 2. 创建 Blob 可以通过 Blob 构造函数创建 Blob …...

Debezium + Kafka-connect 实现Postgres实时同步Hologres

基于 Debezium Kafka 的方案实现 PostgreSQL 到 Hologres 的实时数据同步&#xff0c;是一种高可靠性、高扩展性的解决方案。以下是详细的实现步骤&#xff1a; 1. 方案架构 Debezium&#xff1a;捕获 PostgreSQL 的变更数据&#xff08;CDC&#xff09;&#xff0c;并将变更…...

JavaScript性能优化的12种方式

当涉及到JavaScript性能优化时&#xff0c;有几个关键的方面需要考虑。下面是一些常见的JavaScript性能优化技巧和实践&#xff1a; 减少DOM操作&#xff1a; 频繁的DOM操作会导致重绘和重新布局&#xff0c;影响性能。建议将多个DOM操作合并为一个操作&#xff0c;或者使用Do…...

在Ubuntu上安装MEAN Stack的4个步骤

在Ubuntu上安装MEAN Stack的4个步骤为&#xff1a;1.安装MEAN&#xff1b;2.安装MongoDB&#xff1b;3.安装NodeJS&#xff0c;Git和NPM&#xff1b;4.安装剩余的依赖项。 什么是MEAN Stack&#xff1f; 平均堆栈一直在很大程度上升高为基于稳健的基于JavaScript的开发堆栈。…...

集成学习之随机森林

目录 一、集成学习的含义 二、集成学习的代表 三、集成学习的应用 1、分类问题集成。&#xff08;基学习器是分类模型&#xff09; 2、回归问题集成。&#xff08;基学习器是回归模型&#xff09; 3、特征选取集成。 四、Bagging之随机森林 1、随机森林是有多个决策树&a…...

在线JSON格式校验工具站

在线JSON校验格式化工具&#xff08;Be JSON&#xff09;在线,JSON,JSON 校验,格式化,xml转json 工具,在线工具,json视图,可视化,程序,服务器,域名注册,正则表达式,测试,在线json格式化工具,json 格式化,json格式化工具,json字符串格式化,json 在线查看器,json在线,json 在线验…...

SAP的WPS导出找不到路径怎么办;上载报错怎么办

一.打开注册编辑器 二.输入以下地址 计算机\HKEY_CLASSES_ROOT\ExcelWorksheet\Protocol\StdFileEditing\Server 去除掉EXE后面的命令即可 二&#xff1a;WPS上载文件没反应怎么办 如何切换整合模式或多组件模式-WPS学堂 根据官方操作把整合模式改成多组件模式...

Moonlight-16B-A3B: 变革性的高效大语言模型,凭借Muon优化器打破训练效率极限

近日&#xff0c;由Moonshot AI团队推出的Moonlight-16B-A3B模型&#xff0c;再次在AI领域引发了广泛关注。这款全新的Mixture-of-Experts (MoE)架构的大型语言模型&#xff0c;凭借其创新的训练优化技术&#xff0c;特别是Muon优化器的使用&#xff0c;成功突破了训练效率的极…...

rust学习笔记17-异常处理

今天聊聊rust中异常错误处理 1. 基础类型&#xff1a;Result 和 Option&#xff0c;之前判断空指针就用到过 Option<T> 用途&#xff1a;表示值可能存在&#xff08;Some(T)&#xff09;或不存在&#xff08;None&#xff09;&#xff0c;适用于无需错误信息的场景。 f…...

PyTorch系列教程:使用预训练语言模型增强文本分类

文本分类仍是自然语言处理&#xff08;NLP&#xff09;领域的一项基础任务&#xff0c;其目标是将文本数据归入预先设定的类别之中。预训练语言模型的出现极大地提升了这一领域的性能。本文将探讨如何利用 PyTorch 来利用这些模型&#xff0c;展示它们如何能增强文本分类任务。…...

LabVIEW 线性拟合

该 LabVIEW 程序实现了 线性拟合&#xff08;Linear Fit&#xff09;&#xff0c;用于计算给定一组数据点的斜率&#xff08;Slope&#xff09;和截距&#xff08;Intercept&#xff09;&#xff0c;并将结果可视化于 XY Graph 中。本案例适用于数据拟合、实验数据分析、传感器…...

nacos安装,服务注册,服务发现,远程调用3个方法

安装 点版本下载页面 服务注册 每个微服务都配置nacos的地址&#xff0c;都要知道 服务发现 2个是知道了解 远程调用基本实现 远程调用方法2&#xff0c;负载均衡API测试 远程调用方法3&#xff0c;注解 负载均衡的远程调用&#xff0c; 总结 面试题...

k8s主要控制器简述(一)ReplicaSet与Deployment

目录 一、ReplicaSet 关键特性 示例 解释 支持的 Operator 二、Deployment 1. 声明式更新 示例 2. 滚动更新 示例 3. 回滚 示例 4. ReplicaSet 管理 示例 5. 自动恢复 示例 6. 扩展和缩容 示例 示例 一、ReplicaSet ReplicaSet 是 Kubernetes 中的一个核心控…...

Java中的消息中间件对比与解析:RocketMQ vs RabbitMQ

消息中间件&#xff08;Message Queue, MQ&#xff09;是分布式系统中实现异步通信、解耦服务和流量削峰的关键组件。在Java生态中&#xff0c;RocketMQ和RabbitMQ是两个广泛应用的消息队列系统&#xff0c;但它们在设计理念、功能特性和适用场景上存在显著差异。本文将从核心功…...

Android14 Log.isLoggable判断的分析

Android14 Log.isLoggable判断的分析 文章目录 Android14 Log.isLoggable判断的分析一、前言二、答案和分析1、Log.isLoggable 设置成true2、Log.isLoggable 分析&#xff08;1&#xff09;Log.java&#xff08;2&#xff09;android_util_Log.cpp&#xff08;3&#xff09;pro…...

Mac:JMeter 下载+安装+环境配置(图文详细讲解)

&#x1f4cc; 下载JMeter 下载地址&#xff1a;https://jmeter.apache.org/download_jmeter.cgi &#x1f4cc; 无需安装 Apache官网下载 JMeter 压缩包&#xff0c;无需安装&#xff0c;下载解压后放到自己指定目录下即可。 按我自己的习惯&#xff0c;我会在用户 jane 目…...

Python IP解析器 ip2region使用

说明&#xff1a;最近需要在python项目内使用IP定位所在城市的需求&#xff0c;没有采用向外部ISP服务商API请求获取信息的方案&#xff0c;则翻了翻&#xff0c;在搞Java时很多的方案&#xff0c;在Python端反而可选择范围很小。 # 示例查询 ips ["106.38.188.214"…...