深入解析 Oracle 的聚合函数 ROLLUP
目录
- 深入解析 Oracle 的聚合函数 ROLLUP
- 一、ROLLUP 函数概述
- 二、ROLLUP 函数语法
- 三、ROLLUP 实例详解
- (一)基础分组聚合
- (二)引入 ROLLUP 函数
- (三)ROLLUP 与 NULL 值
- (四)多列复杂分组
- 四、ROLLUP 与 GROUPING 函数结合使用
- 五、使用 ROLLUP 的注意事项
- (一)性能考虑
- (二)结果集解读
- (三)与其他函数和语法的兼容性
深入解析 Oracle 的聚合函数 ROLLUP
在数据库的日常使用中,数据的统计与分析是至关重要的环节,而聚合函数则是实现这些操作的得力工具,其中 ROLLUP 函数更是以其独特的功能,为复杂的数据汇总需求提供了高效的解决方案。本文将以Oracle数据库为例深入解析 ROLLUP 函数的原理、用法。
一、ROLLUP 函数概述
ROLLUP 是一种扩展的 GROUP BY 子句操作,它能够在执行分组聚合操作时,额外生成包含小计和总计的结果集。通俗来讲,就是在按照指定列进行分组统计的基础上,自动向上汇总数据,为我们提供多层次的统计信息,这对于生成报表、数据分析等任务来说,极大地简化了操作流程,减少了手动汇总的繁琐步骤。
例如,在一个销售数据库中,我们可能按地区、产品类别进行分组统计销售额。使用 ROLLUP,不仅能得到每个地区、每个产品类别的销售额小计,还能直接得出所有地区、所有产品类别的总销售额,一步到位呈现出完整的销售数据层次结构。
二、ROLLUP 函数语法
ROLLUP 的基本语法形式如下:
SELECT column1, column2,…, aggregate_function(column)
FROM table_name
GROUP BY ROLLUP (grouping_column1, grouping_column2,…);
其中:
column1, column2,… 是我们希望在结果集中显示的列,这些列可以是参与分组的列,也可以是其他需要展示相关信息的列。
aggregate_function(column) 是常见的聚合函数,如 SUM(求和)、AVG(求平均值)、COUNT(计数)等,用于对指定列进行统计计算。
table_name 为要查询的表名。
ROLLUP (grouping_column1, grouping_column2,…) 中的 grouping_column 则是用于分组的列,ROLLUP 会依据这些列的顺序,依次进行多层次的分组聚合。
三、ROLLUP 实例详解
为了更清晰地理解 ROLLUP 的工作方式,我们假设有一个名为 sales 的表,包含以下字段:region(地区)、product_category(产品类别)、sales_amount(销售额)。
(一)基础分组聚合
首先,我们来看一个普通的 GROUP BY 查询,统计每个地区、每个产品类别的销售额:
SELECT region, product_category, SUM(sales_amount) as total_sales
FROM sales
GROUP BY region, product_category;
这个查询会返回类似下面的结果:
| region | product_category | total_sales |
|---|---|---|
| East | Electronics | 10000 |
| East | Clothing | 5000 |
| West | Electronics | 8000 |
| West | Clothing | 6000 |
这是最基本的按照地区和产品类别分组统计销售额的情况,展示了各个细分组合下的销售额小计。
(二)引入 ROLLUP 函数
现在,我们将上述查询修改为使用 ROLLUP 函数:
SELECT region, product_category, SUM(sales_amount) as total_sales
FROM sales
GROUP BY ROLLUP (region, product_category);
运行这个查询后,结果集会新增一些特殊的行:
| region | product_category | total_sales |
|---|---|---|
| East | Electronics | 10000 |
| East | Clothing | 5000 |
| East | NULL | 15000 |
| West | Electronics | 8000 |
| West | Clothing | 6000 |
| West | NULL | 14000 |
| NULL | NULL | 29000 |
可以看到,除了原本每个地区、产品类别的细分统计外,还出现了每个地区的总计(region 不为空,product_category 为 NULL)以及全局总计(region 和 product_category 都为 NULL)。这里 ROLLUP 按照 region 先进行第一层分组聚合,得到每个地区下各类产品的小计以及地区总计,然后再进行第二层,将所有地区汇总得到全局总计。
(三)ROLLUP 与 NULL 值
注意到结果集中出现的 NULL 值,在 ROLLUP 的语境下,这些 NULL 并非表示数据缺失,而是代表该层级的汇总。例如,当 product_category 为 NULL 且 region 不为 NULL 时,对应的 total_sales 是该地区所有产品类别的销售额总和;当 region 和 product_category 都为 NULL 时,就是整个数据集的销售额总计。
在实际应用中,如果我们不希望看到这些 NULL 值,或者想要以更友好的标识显示,可以使用 NVL 函数(Oracle 中用于处理 NULL 值的函数)来替换:
SELECT NVL(region, 'Total') as region, NVL(product_category, 'All Categories') as product_category, SUM(sales_amount) as total_sales
FROM sales
GROUP BY ROLLUP (region, product_category);
修改后的结果如下:
| region | product_category | total_sales |
|---|---|---|
| East | Electronics | 10000 |
| East | Clothing | 5000 |
| East | All Categories | 15000 |
| West | Electronics | 8000 |
| West | Clothing | 6000 |
| West | All Categories | 14000 |
| Total | All Categories | 29000 |
这样,结果更加清晰易懂,便于阅读和生成报表。
(四)多列复杂分组
假设我们的 sales 表还有一个 year(年份)字段,想要按照年份、地区、产品类别进行更细致的统计分析,同时得到多层次的汇总信息,同样可以使用 ROLLUP 函数:
SELECT year, region, product_category, SUM(sales_amount) as total_sales
FROM sales
GROUP BY ROLLUP (year, region, product_category);
结果集会按照年份、地区、产品类别的层级依次展开小计与总计,例如:
| year | region | product_category | total_sales |
|---|---|---|---|
| 2020 | East | Electronics | 4000 |
| 2020 | East | Clothing | 2000 |
| 2020 | East | NULL | 6000 |
| 2020 | West | Electronics | 3000 |
| 2020 | West | Clothing | 2500 |
| 2020 | West | NULL | 5500 |
| 2020 | NULL | NULL | 11500 |
| 2021 | East | Electronics | 6000 |
| 2021 | East | Clothing | 3000 |
| 2021 | East | NULL | 9000 |
| 2021 | West | Electronics | 5000 |
| 2021 | West | Clothing | 3500 |
| 2021 | West | NULL | 8500 |
| 2021 | NULL | NULL | 17500 |
| NULL | NULL | NULL | 29000 |
这里先是按年份分组,在每个年份内又按照地区、产品类别进行细分汇总,最后再汇总所有年份的数据得到全局总计,层层递进,提供了全面且结构化的销售数据分析。
四、ROLLUP 与 GROUPING 函数结合使用
在处理 ROLLUP 结果集时,有时我们需要确切地知道某一行是属于原始分组数据,还是某个层级的汇总数据。这时,可以结合 GROUPING 函数来实现。
GROUPING 函数接受一个分组列作为参数,返回一个 0 或 1 的值。如果该行对应的分组列是原始数据,返回 0;如果是汇总行,返回 1。
例如:
SELECT region, product_category, SUM(sales_amount) as total_sales,GROUPING(region) as region_grouping, GROUPING(product_category) as product_category_grouping
FROM sales
GROUP BY ROLLUP (region, product_category);
结果如下:
| region | product_category | total_sales | region_grouping | product_category_grouping |
|---|---|---|---|---|
| East | Electronics | 10000 | 0 | 0 |
| East | Clothing | 5000 | 0 | 0 |
| East | NULL | 15000 | 0 | 1 |
| West | Electronics | 8000 | 0 | 0 |
| West | Clothing | 6000 | 0 | 0 |
| West | NULL | 14000 | 0 | 1 |
| NULL | NULL | 29000 | 1 | 1 |
通过这两个额外的列,我们能清晰地分辨出每行数据的性质,方便后续根据不同情况进行数据处理或展示格式调整。
五、使用 ROLLUP 的注意事项
(一)性能考虑
由于 ROLLUP 会生成额外的汇总行,相较于普通的 GROUP BY 查询,在大数据集上可能会消耗更多的计算资源和时间。因此,在实际使用中,尤其是处理海量数据时,要关注查询性能。可以通过合理创建索引、优化数据库配置、限制不必要的列查询等方式来缓解性能压力。
(二)结果集解读
理解 ROLLUP 结果集中 NULL 值以及汇总行的含义至关重要,避免因误解数据而导致错误的决策。建议结合业务逻辑,对结果进行仔细核对和验证,必要时使用如 NVL、GROUPING 等函数辅助解读。
(三)与其他函数和语法的兼容性
在复杂的查询语句中,ROLLUP 与 HAVING 子句、子查询、连接查询等结合使用时,需要注意语法规则和执行顺序。确保各部分逻辑正确,查询结果符合预期,避免因疏忽引发的错误。
ROLLUP 函数为我们提供了便捷的数据汇总能力,熟练掌握其用法,能够在数据库数据分析与报表生成等诸多业务场景中如虎添翼,大幅提升工作效率,挖掘数据深层价值。
相关文章:
深入解析 Oracle 的聚合函数 ROLLUP
目录 深入解析 Oracle 的聚合函数 ROLLUP一、ROLLUP 函数概述二、ROLLUP 函数语法三、ROLLUP 实例详解(一)基础分组聚合(二)引入 ROLLUP 函数(三)ROLLUP 与 NULL 值(四)多列复杂分组…...
Wend看源码-Java-集合学习(List)
摘要 本篇文章深入探讨了基于JDK 21版本的Java.util包中提供的多样化集合类型。在Java中集合共分类为三种数据结构:List、Set和Queue。本文将详细阐述这些数据类型的各自实现,并按照线程安全性进行分类,分别介绍非线程安全与线程安全的实现方…...
【软件】教务系统成绩提交工具使用步骤
【软件】教务系统成绩提交工具使用步骤 零、快速开始 安装 与大多数软件一样,安装步骤很简单,一直点击“下一步”即可快速完成安装,安装完成后,在桌面会有一个软件图标,双击即可打开软件主界面。 导入成绩到Excel中…...
IPsec协议,网络安全的秘密
IPsec概述 IPsec是一组基于网络层的安全协议,是保护IP数据包在网络传输过程中保持安全、隐秘以及真实。通过对IP数据包进行一些加密、认证,来防止数据在传输过程中被窃取、篡改甚至伪造,IPsec在企业内部网络的通信、远程办公、云服务连接等场…...
浅谈下Spring MVC的执行流程
什么是Spring MVC Spring MVC是一个基于Java的Web框架,用于构建Web应用程序。 它是Spring Framework的一部分,它提供了模型-视图-控制器(MVC)架构。 支持RESTful风格的URL请求,易于与其他视图技术集成,如…...
khadas edge2安装ubuntu22.04与ubuntu20.04 docker镜像
khadas edge2安装ubuntu22.04与ubuntu20.04 docker镜像 一、资源准备1.1 镜像文件1.2 刷机工具1.3 ubuntu20.04 docker镜像(具备demon无人机所需各种驱动) 二、开始刷机(安装ubuntu22.04系统)2.1 进入刷机状态2.2 刷机 三、docker…...
GitLab 服务变更提醒:中国大陆、澳门和香港用户停止提供服务(GitLab 服务停止)
目录 前言 一. 变更详情 1. 停止服务区域 2. 邮件通知 3. 新的服务提供商 4. 关键日期 5. 行动建议 二. 迁移指南 三. 注意事项 四. 相关推荐 前言 近期,许多位于中国大陆、澳门和香港的 GitLab 用户收到了一封来自 GitLab 官方的重要通知。根据这封邮件…...
主成分分析是线性降维方法
主成分分析是线性降维方法 主成分分析(PCA)是一种常用的线性降维方法。它通过线性变换将原始数据映射到新的坐标系中,使得数据在新坐标系中的第一个坐标(第一个主成分)具有最大的方差,以此类推,…...
Webpack在Vue CLI中的应用
webpack 作为目前最流行的项目打包工具,被广泛使用于项目的构建和开发过程中,其实说它是打包工具有点大材小用了,我个人认为它是一个集前端自动化、模块化、组件化于一体的可拓展系统,你可以根据自己的需要来进行一系列的配置和安…...
继承超详细介绍
一 、继承 1 继承的概念 继承是面向对象程序设计使得代码可以复用的最重要手段,它使得我们可以在原有类的特性的基础上进行扩展,增加方法和属性(成员函数与成员变量),这样产生新的类,叫作派生类。继承呈现了…...
wordpress调用指定ID分类下浏览最多的内容
要在WordPress中调用指定ID分类下浏览最多的内容,你可以通过以下方法实现: <?php $post_num 8; // 设置调用条数 $wdpidproduct 2; // 假设这是你要查询的分类ID $args array(post_password > ,post_status > publish, // wodepress.comca…...
18.springcloud_openfeign之扩展组件二
文章目录 一、前言二、子容器默认组件FeignClientsConfigurationDecoder的注入Contract约定 对注解的支持对类上注解的支持对方法上注解的支持对参数上注解的支持MatrixVariablePathVariableRequestParamRequestHeaderSpringQueryMapRequestPartCookieValue FormattingConversi…...
FreePBX修改IP地址和端口以及添加SSL证书开启HTTPS访问
最近给单位部署了freepbx网络电话系统,我的系统是安装在ibm x3650 m4物理机上的,iso镜像下载后直接用Rufus烧录到U盘,服务器上先做好了raid1,插上U盘重启服务器开撸。安装过程略过了,在虚拟机上安装就不用那么麻烦。 …...
运算符 - 算术、关系、逻辑运算符
引言 在编程中,运算符是用于执行特定操作的符号。C 提供了多种类型的运算符,包括算术运算符、关系运算符和逻辑运算符等。理解这些运算符及其用法对于编写高效且无误的代码至关重要。本文将详细介绍 C 中的这三种基本运算符,并通过实例帮助读…...
大模型-ChatGLM2-6B模型部署与微调记录
大模型-ChatGLM2-6B模型部署与微调记录 模型权重下载: 登录魔塔社区:https://modelscope.cn/models/ZhipuAI/chatglm2-6b 拷贝以下代码执行后,便可快速权重下载到本地 # 备注:最新模型版本要求modelscope > 1.9.0 # pip insta…...
RDFS—RDF模型属性扩展解析
目录 前言1. 什么是RDFS?1.1 RDFS的核心概念1.2 RDFS与RDF的区别 2. RDFS的基础概念2.1 类(Class)2.2 属性(Property)2.3 关系(Relation)2.4 定义域(Domain)2.5 值域&…...
pyqt和pycharm环境搭建
安装 python安装: https://www.python.org/downloads/release/python-3913/ python3.9.13 64位(记得勾选Path环境变量) pycharm安装: https://www.jetbrains.com/pycharm/download/?sectionwindows community免费版 换源: pip config se…...
salesforce 控制 Experience Cloud 站点用户可以看到哪些用户
在 Salesforce 的 Experience Cloud 中,您可以通过多种方式控制站点用户(如社区用户)之间的可见性。这包括用户之间的信息可见性以及他们可以访问的其他用户数据。以下是几种方法和设置,用于实现对 Experience Cloud 站点用户可见…...
【玩转OCR】 | 腾讯云智能结构化OCR在多场景的实际应用与体验
文章目录 引言产品简介产品功能产品优势 API调用与场景实践图像增强API调用实例发票API调用实例其他场景 结语相关链接 引言 在数字化信息处理的时代,如何高效、精准地提取和结构化各类文档数据成为了企业和政府部门的重要需求。尤其是在面对海量票据、证件、表单和…...
面试题整理20----什么是蓝绿部署、灰度发布、金丝雀发布他们有什么区别?
面试题整理20----什么是蓝绿部署、灰度发布、金丝雀发布,他们有什么区别? 1. 蓝绿部署2. 灰度发布3. 金丝雀发布4. 滚动更新5. 它们的区别 蓝绿部署、灰度发布、金丝雀发布和滚动更新都是软件部署策略,旨在减少发布新版本时的风险,提高系统的稳定性和用…...
网络六边形受到攻击
大家读完觉得有帮助记得关注和点赞!!! 抽象 现代智能交通系统 (ITS) 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 (…...
Java 8 Stream API 入门到实践详解
一、告别 for 循环! 传统痛点: Java 8 之前,集合操作离不开冗长的 for 循环和匿名类。例如,过滤列表中的偶数: List<Integer> list Arrays.asList(1, 2, 3, 4, 5); List<Integer> evens new ArrayList…...
智慧工地云平台源码,基于微服务架构+Java+Spring Cloud +UniApp +MySql
智慧工地管理云平台系统,智慧工地全套源码,java版智慧工地源码,支持PC端、大屏端、移动端。 智慧工地聚焦建筑行业的市场需求,提供“平台网络终端”的整体解决方案,提供劳务管理、视频管理、智能监测、绿色施工、安全管…...
Python爬虫实战:研究feedparser库相关技术
1. 引言 1.1 研究背景与意义 在当今信息爆炸的时代,互联网上存在着海量的信息资源。RSS(Really Simple Syndication)作为一种标准化的信息聚合技术,被广泛用于网站内容的发布和订阅。通过 RSS,用户可以方便地获取网站更新的内容,而无需频繁访问各个网站。 然而,互联网…...
pam_env.so模块配置解析
在PAM(Pluggable Authentication Modules)配置中, /etc/pam.d/su 文件相关配置含义如下: 配置解析 auth required pam_env.so1. 字段分解 字段值说明模块类型auth认证类模块,负责验证用户身份&am…...
【大模型RAG】Docker 一键部署 Milvus 完整攻略
本文概要 Milvus 2.5 Stand-alone 版可通过 Docker 在几分钟内完成安装;只需暴露 19530(gRPC)与 9091(HTTP/WebUI)两个端口,即可让本地电脑通过 PyMilvus 或浏览器访问远程 Linux 服务器上的 Milvus。下面…...
定时器任务——若依源码分析
分析util包下面的工具类schedule utils: ScheduleUtils 是若依中用于与 Quartz 框架交互的工具类,封装了定时任务的 创建、更新、暂停、删除等核心逻辑。 createScheduleJob createScheduleJob 用于将任务注册到 Quartz,先构建任务的 JobD…...
Python实现prophet 理论及参数优化
文章目录 Prophet理论及模型参数介绍Python代码完整实现prophet 添加外部数据进行模型优化 之前初步学习prophet的时候,写过一篇简单实现,后期随着对该模型的深入研究,本次记录涉及到prophet 的公式以及参数调优,从公式可以更直观…...
解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错
出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上,所以报错,到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本,cu、torch、cp 的版本一定要对…...
unix/linux,sudo,其发展历程详细时间线、由来、历史背景
sudo 的诞生和演化,本身就是一部 Unix/Linux 系统管理哲学变迁的微缩史。来,让我们拨开时间的迷雾,一同探寻 sudo 那波澜壮阔(也颇为实用主义)的发展历程。 历史背景:su的时代与困境 ( 20 世纪 70 年代 - 80 年代初) 在 sudo 出现之前,Unix 系统管理员和需要特权操作的…...
