MySQL 使用 `WHERE` 子句时 `COUNT(*)`、`COUNT(1)` 和 `COUNT(column)` 的区别解析
文章目录
- 1. COUNT() 函数的基本作用
- 2. `COUNT(*)`、`COUNT(1)` 和 `COUNT(column)` 的详细对比
- 2.1 `COUNT(*)` —— 统计所有符合条件的行
- 2.2 `COUNT(1)` —— 统计所有符合条件的行
- 2.3 `COUNT(column)` —— 统计某一列非 NULL 的记录数
- 3. 性能对比
- 3.1 `EXPLAIN` 分析
- 4. 哪种方式更好?
- 4.1 如果只是统计行数:
- 4.2 统计某列的非 NULL 值:
- 4.3 `COUNT(1)` 是否比 `COUNT(*)` 快?
- 5. 结论
- **最佳实践**
在 MySQL 查询优化过程中,COUNT(*)、COUNT(1) 和 COUNT(column) 这三种计数方式常常被混淆,尤其是在使用 WHERE 子句进行数据筛选时,它们的执行效率和结果可能有所不同。本文将深入解析这三者的区别,并结合 SQL 执行原理和优化策略,帮助开发者更高效地使用 COUNT() 函数。
1. COUNT() 函数的基本作用
COUNT() 是 SQL 语言中的聚合函数之一,主要用于统计符合条件的记录数。不同的 COUNT() 变体在处理 NULL 值和优化策略方面有所不同。
常见的 COUNT() 语法包括:
COUNT(*):统计表中所有符合条件的行(包括NULL)。COUNT(1):统计表中所有符合条件的行,与COUNT(*)类似。COUNT(column):统计某一列中非 NULL 值的个数。
2. COUNT(*)、COUNT(1) 和 COUNT(column) 的详细对比
2.1 COUNT(*) —— 统计所有符合条件的行
COUNT(*) 计算所有符合 WHERE 条件的行数,不论这些行中的列是否包含 NULL 值。
示例:
SELECT COUNT(*) FROM users WHERE age > 18;
执行原理:
- MySQL 不会具体读取某一列的数据,而是统计符合
WHERE条件的行数。 - 在 InnoDB 存储引擎中,
COUNT(*)可以直接从索引中读取数据(如果合适的索引可用),性能较优。
适用场景:
- 需要统计表中所有符合条件的记录数,且不关心是否有
NULL值时,COUNT(*)是最佳选择。
2.2 COUNT(1) —— 统计所有符合条件的行
COUNT(1) 也是统计符合 WHERE 条件的行数,与 COUNT(*) 类似。
示例:
SELECT COUNT(1) FROM users WHERE age > 18;
执行原理:
COUNT(1)会在每一行返回1,然后统计这些1的个数。- 在 MySQL 优化器看来,
COUNT(1)和COUNT(*)的执行计划通常是相同的。 - 在没有合适索引时,InnoDB 仍需进行全表扫描(或者索引扫描),不会因为
COUNT(1)而有性能提升。
适用场景:
- 和
COUNT(*)作用几乎一致,但一般推荐使用COUNT(*),因为COUNT(*)更符合 SQL 规范,并能适用于所有数据库系统。
2.3 COUNT(column) —— 统计某一列非 NULL 的记录数
COUNT(column) 仅统计某一列中非 NULL 的记录数,而不会统计 NULL 值。
示例:
SELECT COUNT(email) FROM users WHERE age > 18;
执行原理:
- 只有
email列不为NULL的行才会被计入统计。 - MySQL 需要读取
email列的数据,以判断其是否为NULL,因此比COUNT(*)和COUNT(1)可能稍慢(如果email列没有索引)。
适用场景:
- 需要排除
NULL值时,比如统计已填写email地址的用户数量。
3. 性能对比
为了对比 COUNT(*)、COUNT(1) 和 COUNT(column) 的性能,我们进行如下实验:
假设有一个 users 表,其中 id 为主键,email 为可能包含 NULL 的列,数据如下:
| id | name | age | |
|---|---|---|---|
| 1 | 张三 | 20 | zhangsan@a.com |
| 2 | 李四 | 25 | NULL |
| 3 | 王五 | 22 | wangwu@b.com |
| 4 | 赵六 | 19 | NULL |
测试 SQL 及其返回结果如下:
SELECT COUNT(*) FROM users WHERE age > 18; -- 结果:3
SELECT COUNT(1) FROM users WHERE age > 18; -- 结果:3
SELECT COUNT(email) FROM users WHERE age > 18; -- 结果:2 (NULL 值被排除)
3.1 EXPLAIN 分析
如果 users 表的 email 没有索引,那么 COUNT(email) 需要扫描 email 列的数据,会比 COUNT(*) 略慢。
对于 COUNT(*) 和 COUNT(1),InnoDB 通常会直接使用主键索引进行优化,因此在大多数情况下,两者性能相同。
示例 EXPLAIN 结果:
EXPLAIN SELECT COUNT(*) FROM users WHERE age > 18;
| id | select_type | table | type | possible_keys | key | rows | Extra |
|---|---|---|---|---|---|---|---|
| 1 | SIMPLE | users | index | NULL | PRIMARY | 3 | Using index |
Using index 表示 MySQL 直接利用索引进行优化,而无需扫描所有数据。
4. 哪种方式更好?
4.1 如果只是统计行数:
- 推荐使用
COUNT(*),因为它可以利用索引优化,并且与数据库无关,通用性更强。
4.2 统计某列的非 NULL 值:
- 使用
COUNT(column),但要注意 NULL 值不会被计入。
4.3 COUNT(1) 是否比 COUNT(*) 快?
- 在 MySQL 5.7 及以上版本,
COUNT(1)和COUNT(*)在优化器层面已经没有明显性能差异,因此一般推荐使用COUNT(*),更符合 SQL 规范。
5. 结论
| 计数方式 | 作用 | 处理 NULL | 性能优化 |
|---|---|---|---|
COUNT(*) | 统计符合 WHERE 条件的总行数 | 统计所有行(包括 NULL) | 最优(可利用索引) |
COUNT(1) | 统计符合 WHERE 条件的总行数 | 统计所有行(包括 NULL) | 与 COUNT(*) 类似 |
COUNT(column) | 统计某列非 NULL 的行数 | 只统计非 NULL 值 | 可能稍慢(依赖索引情况) |
最佳实践
- 默认使用
COUNT(*),它性能最优且兼容性强。 COUNT(column)适用于特定需求,如统计非 NULL 值个数。- 避免误解
COUNT(1)更快的说法,在现代 MySQL 中它与COUNT(*)无本质区别。
希望这篇文章能帮助你更深入理解 MySQL 计数函数的优化策略,提高查询性能!🚀
相关文章:
MySQL 使用 `WHERE` 子句时 `COUNT(*)`、`COUNT(1)` 和 `COUNT(column)` 的区别解析
文章目录 1. COUNT() 函数的基本作用2. COUNT(*)、COUNT(1) 和 COUNT(column) 的详细对比2.1 COUNT(*) —— 统计所有符合条件的行2.2 COUNT(1) —— 统计所有符合条件的行2.3 COUNT(column) —— 统计某一列非 NULL 的记录数 3. 性能对比3.1 EXPLAIN 分析 4. 哪种方式更好&…...
Linux运维——网络管理
Linux网络管理 一、Linux网络应用要点二、命令常见用法2.1、curl2.1.1、发送GET请求2.1.2、发送POST请求2.1.3、设置请求头2.1.4、处理cookies2.1.5、处理重定向2.1.6、调试和详细信息2.1.7、使用代理2.1.8、文件上传2.1.9、其它常用选项2.1.10、综合示例 2.2、wget2.2.1、基本…...
STM32CUBEIDE FreeRTOS操作教程(十三):task api 任务访问函数
STM32CUBEIDE FreeRTOS操作教程(十三):task api 任务访问函数 STM32CUBE开发环境集成了STM32 HAL库进行FreeRTOS配置和开发的组件,不需要用户自己进行FreeRTOS的移植。这里介绍最简化的用户操作类应用教程。以STM32F401RCT6开发板…...
Jmeter+Jenkins接口压力测试持续集成
项目介绍 接口功能测试应用: http://www.weather.com.cn/data/cityinfo/<city_code>.html 测试功能:获取对应城市的天气预报 请求方法:Get 压测脚本开发工具:jmeter 源码脚本位置: https://github.com/shife…...
深入浅出ES6:现代JavaScript的基石
ES6(ECMAScript 2015)是JavaScript语言的一次重大更新,引入了许多新特性,使JavaScript更加强大、优雅和易于维护。这些特性已经成为现代JavaScript开发的基石,掌握它们对于任何JavaScript开发者都至关重要。本文将深入…...
实现使用RBF(径向基函数)神经网络模拟二阶电机数学模型中的非线性干扰,以及使用WNN(小波神经网络)预测模型中的非线性函数来抵消迟滞影响的功能
下面将详细介绍如何实现使用RBF(径向基函数)神经网络模拟二阶电机数学模型中的非线性干扰,以及使用WNN(小波神经网络)预测模型中的非线性函数来抵消迟滞影响的功能。我们将按照以下步骤进行: 步骤1&#x…...
潜水泵,高效排水,守护城市与农田|深圳鼎跃
洪水是常见的自然灾害,在春夏季节的我国降水多为丰富,容易造成城市内部的洪涝灾害。特别是低洼地区的积水,不仅容易造成城市交通的出行不便,还存在潜在的隐患,严重影响了人们正常生活。 潜水泵作为一种高效、可靠的排水…...
易基因:RNA甲基化修饰和R-loop的交叉调控:从分子机制到临床意义|深度综述
大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因。 R-loop(RNA-DNA杂合结构)是转录调控、DNA复制和修复等关键细胞过程的重要组成部分。但R-loop异常积累可能会破坏基因组完整性,从而导致多种疾病的发生…...
115 道 MySQL 面试题,从简单到深入!
1. 什么是数据库事务? 数据库事务是一个作为单个逻辑工作单元执行的一系列操作。事务具有ACID属性,即原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性…...
一周学会Flask3 Python Web开发-flask3上下文全局变量session,g和current_app
锋哥原创的Flask3 Python Web开发 Flask3视频教程: 2025版 Flask3 Python web开发 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili flask3提供了session,g和current_app上下文全局变量来方便我们操作访问数据。 以下是一个表格,用于比较Flask中的…...
MFC学习笔记-1
一、编辑框和按钮 //.h文件private:CString str;//给窗口类加了一个变量(定义一个成员变量),关联到IDC_EDIT1中(要在实现中关联,源文件文件夹中)CString str2;//接收button2,和IDC_EDIT2绑定 p…...
Linux搜索查找类指令
1、find指令 基本语法:find [搜索范围] [选项] 功能:将从指定目录向下递归地遍历其各个子目录,将满足条件的文件或目录显示在终端。 常用选项: 操作 命令示例 说明 查找指定路径下的所有文件 find /path/to/dir 查找指定目…...
江协科技/江科大-51单片机入门教程——P[1-1] 课程简介P[1-2] 开发工具介绍及软件安装
本教程也力求在玩好单片机的同时了解一些计算机的基本概念,了解电脑的一些基本操作,了解电路及其元器件的基本理论,为我们学习更高级的单片机,入门IT和信息技术行业,打下一定的基础。 目录 1.课程简介 2.开发工具及…...
监听load和hashchange事件
监听load和hashchange事件 上篇文章中,我们已经将菜谱的数据给拿到,并且已经可以渲染到页面上,本篇我们将为程序添加一些事件; 注:本项目来自于Jonas Schmedtmann创建,文章仅仅作为学习作用! 菜…...
深度剖析Seata源码:解锁分布式事务处理的核心逻辑
文章目录 写在文章开头如何使用源码(配置转掉)基于AT模式详解Seata全链路流程Seata服务端启动本地服务如何基于GlobalTransaction注解开启事务客户端如何开启分布式事务RM和TC如何协调处理分支事务RM生成回滚日志事务全局提交与回滚小结参考写在文章开头 在当今分布式系统日益…...
在 Ansys Mechanical 中解决干涉拟合
有意和无意的过盈配合在工程设计和有限元分析 (FEA) 中很常见。当两个组件重叠或接触时,就会发生这种情况,从而产生应力和变形,必须仔细分析以确保功能正常。有意干涉,例如轴和轴承之间的压配合或用于固定金…...
JMeter性能问题
性能测试中TPS上不去的几种原因 性能测试中TPS上不去的几种原因_tps一直上不去-CSDN博客 网络带宽 连接池 垃圾回收机制 压测脚本 通信连接机制 数据库配置 硬件资源 压测机 业务逻辑 系统架构 CPU过高什么原因 性能问题分析-CPU偏高 - 西瓜汁拌面 - 博客园 US C…...
美国国防部(DoD)SysML v2迁移指南项目
DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 分享一篇SysML v1向SysML v2迁移的资料。 下载地址:https://ndia.dtic.mil/wp-content/uploads/2023/systems/Thurs_1560710_Stirk.pdf 核心内容用DeepSeek整理如下&#…...
JavaWeb-GenericServlet源码分析(适配器/模板方法)
文章目录 类直接实现Servlet接口的弊端Servlet接口的方法适配器设计模式 适配器对象的改造关于init方法的ServletConfig对象来源使用模板方法设计模式改造init方法 GenericServlet内置抽象类ServletConfig接口ServletConfig接口简介测试再谈GenericServlet抽象类 类直接实现Ser…...
微机原理与汇编语言试题四
一、单项选择 1.(单选题)()指向的内存单元的值被CPU做为指令执行。 A. DS:SI B. CS:IP C. SS:SP D. ES:DI 正确答案:B 2.(单选题)当RESET信号进入高电平状态时,将使8086的()寄存器初始化为0FFFFH A. SS B. DS C. ES D. CS 正确答案:D 3.(单选题)堆栈段寄存器是( …...
idea大量爆红问题解决
问题描述 在学习和工作中,idea是程序员不可缺少的一个工具,但是突然在有些时候就会出现大量爆红的问题,发现无法跳转,无论是关机重启或者是替换root都无法解决 就是如上所展示的问题,但是程序依然可以启动。 问题解决…...
质量体系的重要
质量体系是为确保产品、服务或过程质量满足规定要求,由相互关联的要素构成的有机整体。其核心内容可归纳为以下五个方面: 🏛️ 一、组织架构与职责 质量体系明确组织内各部门、岗位的职责与权限,形成层级清晰的管理网络…...
linux 错误码总结
1,错误码的概念与作用 在Linux系统中,错误码是系统调用或库函数在执行失败时返回的特定数值,用于指示具体的错误类型。这些错误码通过全局变量errno来存储和传递,errno由操作系统维护,保存最近一次发生的错误信息。值得注意的是,errno的值在每次系统调用或函数调用失败时…...
【JavaSE】绘图与事件入门学习笔记
-Java绘图坐标体系 坐标体系-介绍 坐标原点位于左上角,以像素为单位。 在Java坐标系中,第一个是x坐标,表示当前位置为水平方向,距离坐标原点x个像素;第二个是y坐标,表示当前位置为垂直方向,距离坐标原点y个像素。 坐标体系-像素 …...
JS手写代码篇----使用Promise封装AJAX请求
15、使用Promise封装AJAX请求 promise就有reject和resolve了,就不必写成功和失败的回调函数了 const BASEURL ./手写ajax/test.jsonfunction promiseAjax() {return new Promise((resolve, reject) > {const xhr new XMLHttpRequest();xhr.open("get&quo…...
08. C#入门系列【类的基本概念】:开启编程世界的奇妙冒险
C#入门系列【类的基本概念】:开启编程世界的奇妙冒险 嘿,各位编程小白探险家!欢迎来到 C# 的奇幻大陆!今天咱们要深入探索这片大陆上至关重要的 “建筑”—— 类!别害怕,跟着我,保准让你轻松搞…...
CSS | transition 和 transform的用处和区别
省流总结: transform用于变换/变形,transition是动画控制器 transform 用来对元素进行变形,常见的操作如下,它是立即生效的样式变形属性。 旋转 rotate(角度deg)、平移 translateX(像素px)、缩放 scale(倍数)、倾斜 skewX(角度…...
【LeetCode】3309. 连接二进制表示可形成的最大数值(递归|回溯|位运算)
LeetCode 3309. 连接二进制表示可形成的最大数值(中等) 题目描述解题思路Java代码 题目描述 题目链接:LeetCode 3309. 连接二进制表示可形成的最大数值(中等) 给你一个长度为 3 的整数数组 nums。 现以某种顺序 连接…...
区块链技术概述
区块链技术是一种去中心化、分布式账本技术,通过密码学、共识机制和智能合约等核心组件,实现数据不可篡改、透明可追溯的系统。 一、核心技术 1. 去中心化 特点:数据存储在网络中的多个节点(计算机),而非…...
快速排序算法改进:随机快排-荷兰国旗划分详解
随机快速排序-荷兰国旗划分算法详解 一、基础知识回顾1.1 快速排序简介1.2 荷兰国旗问题 二、随机快排 - 荷兰国旗划分原理2.1 随机化枢轴选择2.2 荷兰国旗划分过程2.3 结合随机快排与荷兰国旗划分 三、代码实现3.1 Python实现3.2 Java实现3.3 C实现 四、性能分析4.1 时间复杂度…...
