当前位置：首页 > news >正文

正则表达式完全指南，总结全面通俗易懂

news 2026/5/13 1:55:23

元字符

连接符

限定符

定位符

修饰符（标记）

运算符优先级

普通字符集及其替换

零宽断言

正向先行断言

负向先行断言

正向后发断言

负向后发断言

捕获组

普通捕获组

命名捕获组

PS:非捕获组

正则表达式在线测试: 正则在线测试工具

元字符

字符	描述
\d	匹配一个数字字符。等价于 [0-9]。
\D	匹配一个非数字字符。等价于 [^0-9]。
\s	匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。
\S	匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\w	匹配字母、数字、下划线。等价于'[A-Za-z0-9_]'。
\W	匹配非字母、数字、下划线。等价于 '[^A-Za-z0-9_]'。
\n	匹配一个换行符。等价于 \x0a 和 \cJ。
\r	匹配一个回车符。等价于 \x0d 和 \cM。
\t	匹配一个制表符。等价于 \x09 和 \cI。
\f	匹配一个换页符。等价于 \x0c 和 \cL。
\	将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如，'n' 匹配字符 "n"。'\n' 匹配一个换行符。序列 '\\' 匹配 "\" 而 "\(" 则匹配 "("。
.	匹配除换行符（\n、\r）之外的任何单个字符。要匹配包括 '\n' 在内的任何字符，请使用像"(.\|\n)"的模式。
[ ]	字符种类。匹配方括号内的任意字符。
[^ ]	否定的字符种类。匹配除了方括号里的任意字符

连接符

字符	描述
[0-9]	匹配数字,等价于\d
[a-z]	匹配英文小写字母
[A-Z]	匹配英文大写字母
[0-9a-zA-z]	匹配数字或英文字母
[\u4e00-\u9fa5]	匹配一个汉字

限定符

限定符用来指定正则表达式的一个给定组件必须要出现多少次才能满足匹配。有 * 或 + 或 ? 或 {n} 或 {n,} 或 {n,m} 共6种。

正则表达式的限定符有：

字符	描述
*	匹配前面的子表达式零次或多次。例如，zo* 能匹配 "z" 以及 "zoo"。* 等价于 {0,}。
+	匹配前面的子表达式一次或多次。例如，zo+ 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。+ 等价于 {1,}。
?	匹配前面的子表达式零次或一次。例如，do(es)? 可以匹配 "do" 、 "does"、 "doxy" 中的 "do" 和 "does"。? 等价于 {0,1}。
{n}	n 是一个非负整数。匹配确定的 n 次。例如，o{2} 不能匹配 "Bob" 中的 o，但是能匹配 "food" 中的两个 o。
{n,}	n 是一个非负整数。至少匹配n 次。例如，o{2,} 不能匹配 "Bob" 中的 o，但能匹配 "foooood" 中的所有 o。o{1,} 等价于 o+。o{0,} 则等价于 o*。
{n,m}	m 和 n 均为非负整数，其中 n <= m。最少匹配 n 次且最多匹配 m 次。例如，o{1,3} 将匹配 "fooooood" 中的前三个 o。o{0,1} 等价于 o?。请注意在逗号和两个数之间不能有空格。

定位符

定位符使您能够将正则表达式固定到行首或行尾。它们还使您能够创建这样的正则表达式，这些正则表达式出现在一个单词内、在一个单词的开头或者一个单词的结尾。

定位符用来描述字符串或单词的边界，^ 和 $ 分别指字符串的开始与结束，\b 描述单词的前或后边界，\B 表示非单词边界。

正则表达式的定位符有：

字符	描述
^	匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性，^ 还会与 \n 或 \r 之后的位置匹配。
$	匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性，$ 还会与 \n 或 \r 之前的位置匹配。
\b	匹配一个单词边界，即字与空格间的位置。
\B	非单词边界匹配。

注意：不能将限定符与定位符一起使用。由于在紧靠换行或者单词边界的前面或后面不能有一个以上位置，因此不允许诸如 ^* 之类的表达式。

若要匹配一行文本开始处的文本，请在正则表达式的开始使用 ^ 字符。不要将 ^ 的这种用法与中括号表达式内的用法混淆。

修饰符（标记）

标记也称为修饰符，正则表达式的标记用于指定额外的匹配策略。

标记不写在正则表达式里，标记位于表达式之外，格式如下：

修饰符	含义	描述
i	ignore - 不区分大小写	将匹配设置为不区分大小写，搜索时不区分大小写: A 和 a 没有区别。
g	global - 全局匹配	查找所有的匹配项。
m	multi line - 多行匹配	使边界字符 ^ 和 $ 匹配每一行的开头和结尾，记住是多行，而不是整个字符串的开头和结尾。
s	特殊字符圆点 . 中包含换行符 \n	默认情况下的圆点 . 是匹配除换行符 \n 之外的任何字符，加上 s 修饰符之后, . 中包含换行符 \n。

运算符优先级

正则表达式从左到右进行计算，并遵循优先级顺序，这与算术表达式非常类似。

相同优先级的从左到右进行运算，不同优先级的运算先高后低。下表从最高到最低说明了各种正则表达式运算符的优先级顺序：

运算符	描述
\	转义符
(), (?:), (?=), []	圆括号和方括号
*, +, ?, {n}, {n,}, {n,m}	限定符
^, $, \任何元字符、任何字符	定位点和序列（即：位置和顺序）
\|	替换，"或"操作字符具有高于替换运算符的优先级，使得"m\|food"匹配"m"或"food"。若要匹配"mood"或"food"，请使用括号创建子表达式，从而产生"(m\|f)ood"。

普通字符集及其替换

符号	替换正则	描述
\d	[0-9]	匹配数字字符
\D	[^0-9]	匹配非数字字符
\w	0-9a-zA-z]	匹配数字或字母或下划线
\W	[^\w]	匹配非数字或字母或下划线
\s	[\r\t\n\f]	匹配任意的空白符，如空格，换行符，制表符等
\S	[^\s]	匹配任意不是空白符的字符

零宽断言

所谓断言，是用来声明一个应该为真的事实。在正则表达式中，只有当断言为真时才会继续进行匹配。
零宽断言：像用于查找某些内容之前或者之后的东西，其中一些特殊字符如“\b、^、$”等用于指定一个位置，这个位置应满足一定的条件。

正向先行断言

(?=pattern) 匹配 pattern 之前的位置，即：要想满足匹配，后面得跟着 pattern

负向先行断言

(?!pattern) 匹配 pattern 之前的位置，即：要想满足匹配，后面不能跟着 pattern

正向后发断言

(?<=pattern) 匹配 pattern 之后的位置，即：要想满足匹配，前面得跟着 pattern

负向后发断言

(?<!pattern) 匹配 pattern 之后的位置，即：要想满足匹配，前面不能跟着 pattern

规律 所谓”正”，即字符中需要出现 pattern ；所谓“负”，即字符中不能出现 pattern ；所谓“先”，即匹配在 pattern 前的位置； 所谓“后”，即匹配在 pattern 后的位置；

捕获组

捕获组分为：

普通捕获组(Expression)
命名捕获组(?Expression)

普通捕获组

从正则表达式左侧开始，每出现一个左括号"("记做一个分组，分组编号从 1 开始。0 代表整个表达式。

对于时间字符串：2017-04-25，表达式如下

(\\d{4})-((\\d{2})-(\\d{2}))

有 4 个左括号，所以有 4 个分组:

编号	捕获组	匹配
0	(\d{4})-((\d{2})-(\d{2}))	2017-04-25
1	(\d{4})	2017
2	((\d{2})-(\d{2}))	04-25
3	(\d{2})	04
4	(\d{2})	25

public static final String DATE_STRING = "2017-04-25";
public static final String P_COMM = "(\\d{4})-((\\d{2})-(\\d{2}))";Pattern pattern = Pattern.compile(P_COMM);
Matcher matcher = pattern.matcher(DATE_STRING);
matcher.find();//必须要有这句System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0)); 
System.out.printf("\nmatcher.group(1) value:%s", matcher.group(1)); 
System.out.printf("\nmatcher.group(2) value:%s", matcher.group(2)); 
System.out.printf("\nmatcher.group(3) value:%s", matcher.group(3)); 
System.out.printf("\nmatcher.group(4) value:%s", matcher.group(4));

命名捕获组

每个以左括号开始的捕获组，都紧跟着 ?，而后才是正则表达式。

对于时间字符串：2017-04-25，表达式如下:

(?<year>\\d{4})-(?<md>(?<month>\\d{2})-(?<date>\\d{2}))

有 4 个命名的捕获组，分别是:

编号	名称	捕获组	匹配
0	0	(?\d{4})-(?(?\d{2})-(?\d{2}))	2017-04-25
1	year	(?\d{4})-	2017
2	md	(?(?\d{2})-(?\d{2}))	04-25
3	month	(?\d{2})	04
4	date	(?\d{2})	25

命名的捕获组同样也可以使用编号获取相应值。

public static final String P_NAMED = "(?<year>\\d{4})-(?<md>(?<month>\\d{2})-(?<date>\\d{2}))";
public static final String DATE_STRING = "2017-04-25"; 
Pattern pattern = Pattern.compile(P_NAMED);
Matcher matcher = pattern.matcher(DATE_STRING);
matcher.find();System.out.printf("\n===========使用名称获取============="); 
System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0)); 
System.out.printf("\n matcher.group('year') value:%s", matcher.group("year")); 
System.out.printf("\nmatcher.group('md') value:%s", matcher.group("md")); 
System.out.printf("\nmatcher.group('month') value:%s", matcher.group("month")); 
System.out.printf("\nmatcher.group('date') value:%s", matcher.group("date"));matcher.reset();System.out.printf("\n===========使用编号获取=============");
matcher.find(); 
System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0)); 
System.out.printf("\nmatcher.group(1) value:%s", matcher.group(1)); 
System.out.printf("\nmatcher.group(2) value:%s", matcher.group(2)); 
System.out.printf("\nmatcher.group(3) value:%s", matcher.group(3)); 
System.out.printf("\nmatcher.group(4) value:%s", matcher.group(4));

PS:非捕获组

在左括号后紧跟 ?:，而后再加上正则表达式，构成非捕获组 (?:Expression)。

对于时间字符串：2017-04-25，表达式如下:

(?:\\d{4})-((\\d{2})-(\\d{2}))

这个正则表达式虽然有四个左括号，理论上有 4 个捕获组。但是第一组 (?:\d{4})，其实是被忽略的。当使用 matcher.group(4) 时，系统会报错。

编号	捕获组	匹配
0	(\d{4})-((\d{2})-(\d{2}))	2017-04-25
1	((\d{2})-(\d{2}))	04-25
2	(\d{2})	04
3	(\d{2})	25

public static final String P_UNCAP = "(?:\\d{4})-((\\d{2})-(\\d{2}))";
public static final String DATE_STRING = "2017-04-25";Pattern pattern = Pattern.compile(P_UNCAP);
Matcher matcher = pattern.matcher(DATE_STRING);
matcher.find();System.out.printf("\nmatcher.group(0) value:%s", matcher.group(0)); 
System.out.printf("\nmatcher.group(1) value:%s", matcher.group(1)); 
System.out.printf("\nmatcher.group(2) value:%s", matcher.group(2)); 
System.out.printf("\nmatcher.group(3) value:%s", matcher.group(3));// Exception in thread "main" java.lang.IndexOutOfBoundsException: No group 4 
System.out.printf("\nmatcher.group(4) value:%s", matcher.group(4));

总结

普通捕获组使用方便；
命名捕获组使用清晰；
非捕获组目前在项目中还没有用武之地。

正则表达式完全指南，总结全面通俗易懂

目录元字符连接符限定符定位符修饰符（标记） 运算符优先级普通字符集及其替换零宽断言正向先行断言负向先行断言正向后发断言负向后发断言捕获组普通捕获组命名捕获组 PS:非捕获组正则表达式在线测试: 正则在线测试工具 …...

编程日记 2024/11/20 22:27:41

运维面试题.云计算面试题之三ELK

1.ELK是什么？ ELK 其实并不是一款软件，而是一整套解决方案，是三个软件产品的首字母缩写 Elasticsearch：负责日志检索和储存 Logstash：负责日志的收集和分析、处理 Kibana：负责日志的可视化这三款软件都是开源软件，通常是配合使用，而且又先后归于 Elastic.co 公司名下，…...

编程日记 2024/11/20 22:18:29

C# DataTable使用Linq查询详解

前奏- C# 对DataTable进行查询 C# 可以对 DataTable 进行查询。在 .NET 框架中，DataTable 类提供了几种方法来查询数据，包括 Select 方法和 AsEnumerable 扩展方法（在 System.Data.DataSetExtensions 命名空间中）。使用 Select…...

编程日记 2024/11/20 22:16:27

【企业级分布式系统】ELK优化

文章目录 Elasticsearch作为日志存储时的优化优化ES索引设置优化线程池配置锁定内存，不让JVM使用Swap减少分片数、副本数 Elasticsearch作为日志存储时的优化 linux内核优化、JVM优化、ES配置优化、架构优化（filebeat/fluentd代替logstash、加入kafka做…...

编程日记 2024/11/20 22:14:24

51单片机基础05 定时器

目录一、为什么要定时器二、定时器中断 1、定时器中断参数 2、定时器中断程序 3、定时器计数一、为什么要定时器前文提到，比如进行流水灯等操作，都是直接写了delay_ms这类操作。但是在51单片机中，其一般就是靠双for进行的循环时延&…...

编程日记 2024/11/20 22:12:21

tdengine学习笔记实战-jdbc连接tdengine数据库

先上代码，里面有两种获取连接的方式，一个单例，一个连接池 package com.tdengine.utils;import com.alibaba.druid.pool.DruidDataSource;import java.sql.*; import java.util.Properties;public class TDConnectUtils {// 单例对象private …...

编程日记 2024/11/20 22:11:19

vue3项目执行npm install下载依赖报错问题排查方法

1、检查当前node与npm的版本 nodejs 和 npm 的版本是有适配的，具体可以看官网：nodejs 和 npm 的版本是有适配的若是版本不兼容，修改node或者npm的版本即可，建议使用nvm版本管理工具，切换方便； 2、清除缓…...

编程日记 2024/11/20 22:06:11

【vue】项目迭代部署后自动清除浏览器缓存

前言： vue项目打包部署上线后，因浏览器缓存问题，导致用户访问的依旧是上个迭代批次的旧资源，需要用户手动清除缓存才能更新至最新版本，影响用户体验。解决方法： html根文件添加以下标签 <meta http-eq…...

编程日记 2024/11/20 22:05:10

Leetcode（滑动窗口习题思路总结，持续更新。。。）

讲解题目：长度最小的子数组给定一个含有 n 个正整数的数组和一个正整数 target ，找出该数组中满足其和 ≥ target 的长度最小的连续子数组。如果不存在符合条件的连续子数组，返回 0。示例: 输入: target 7, nums [2,3,1,2,4,3] 输出: 2 解…...

编程日记 2024/11/20 22:00:04

【UNIAPP】uniapp版图片压缩工具

二次封装的uniapp版本图片压缩、上传工具，支持全端（H5、小程序、APP） 新建文件：file-util.js class FileUtil {/*** [文件上传]* param {[object]} fileObj [图片地址]* param {[object]} formData [参数]* param {[str…...

编程日记 2024/11/20 21:58:01

PaddlePaddle 开源产业级文档印章识别PaddleX-Pipeline “seal_recognition”模型开箱即用篇（一）

AI时代到来，各行各业都在追求细分领域垂直类深度学习模型，今天给大家介绍一个PaddlePaddle旗下，基于PaddleX Pipeline 来完成印章识别的模型“seal_recognition”。官方地址：https://github.com/PaddlePaddle/PaddleX/blob/relea…...

编程日记 2024/11/20 21:50:48

Vue3 + Vite 项目引入 Typescript

文章目录一、TypeScript简介二、TypeScript 开发环境搭建三、编译方式1. 自动编译单个文件2. 自动编译整个项目四、配置文件1. compilerOptions基本选项严格模式相关选项（启用 strict 后自动包含这些）模块与导入相关选项 2. include 和 excludeinclude…...

编程日记 2024/11/20 21:47:43

微信小程序实战篇-分类页面制作

一、项目背景与目标在微信小程序开发中，分类页面是一个常见且重要的功能模块。它能够帮助用户快速定位和浏览不同类别的商品或信息，提升用户体验和操作效率。今天，我们将深入探讨如何制作一个实用的微信小程序分类页面，先来看一下…...

编程日记 2024/11/20 21:46:40

第三十七章如何清理docker 日志

如何清理docker 日志目标掌握docker 日志设置掌握docker日志的清理办法背景在现代软件开发和部署环境中，Docker 容器技术因其轻量级、可移植性和高效资源利用的特点，已成为许多企业和开发团队的首选。Docker 容器在运行过程中会产生大量的日志信息，这些日志对于监控容器…...

编程日记 2024/11/20 21:42:36

二刷代码随想录第七天

454. 四数相加 II 先用map记录前两个数的和num1 num2的值出现了多少次再在后两个数组里找0 - (num1 num2),找到后就累加map中的次数 class Solution { public:int fourSumCount(vector<int>& nums1, vector<int>& nums2, vector<int>& nums3…...

编程日记 2024/11/20 21:41:35

1.tree of thought (使用LangChain解决4x4数独问题)

本教程将介绍如何使用LangChain库和chatglm API来解决一个4x4的数独问题。我们将通过以下步骤实现这一目标： 初始化chatglm 的聊天模型。定义数独问题和解决方案。创建一个自定义的检查器来验证每一步的思考。使用ToTChain来运行整个思考过程。 1. 初始化chatglm4…...

编程日记 2024/11/20 21:38:27

网络基础（4）IP协议

经过之前的学习对传输协议的学习，对于传输协议从系统底层到应用层对于socket套接字的学习已经有了一套完整的理论。对于网络的层状结构，现在已经学习到了应用层和传输层: 在之前的学习中，通信的双方都只考虑了双方的传输层的东西&#xff0…...

编程日记 2024/11/20 21:35:21

124. 二叉树中的最大路径和【力扣(LeetCode) 】

文章目录零、原题链接一、题目描述二、测试用例三、解题思路四、参考代码零、原题链接 124. 二叉树中的最大路径和一、题目描述二叉树中的路径被定义为一条节点序列，序列中每对相邻节点之间都存在一条边。同一个节点在一条路径序列中至多出现一次。该路径…...

编程日记 2024/11/20 21:34:19

echarts：简单实现默认显示两柱子折线，点击按钮后显示新的柱子

问： 用echarts实现：默认显示两柱子折线，点击“税率”按钮，显示税率柱子，之前的两柱子折线消失回答： <!DOCTYPE html> <html lang"zh"> <head><meta charset"UTF-8…...

编程日记 2024/11/20 21:33:17

视频里的音频怎么提取出来成单独文件？音频提取照着这些方法做

在数字时代，视频与音频的分离与重组已成为日常需求之一。无论是出于制作背景音乐、保存讲座内容，还是编辑播客素材，提取视频中的音频并将其保存为单独文件都显得尤为重要。视频里的音频怎么提取出来成单独文件？本文将详细介绍几种…...

编程日记 2024/11/20 21:31:14

边缘计算中的机器学习能效优化与混合架构实践

1. 边缘计算中的机器学习能效革命在智能手表、健康监测设备等穿戴式设备中，实时运行机器学习模型一直是个棘手的问题。传统方案要么耗电太快导致续航崩溃，要么精度太低失去实用价值。我们团队最近实验的一组数据很能说明问题：在常见的运动识别…...

编程新知 2026/5/13 1:17:16

OpenClaw 如何实现任务恢复与失败重试？

网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、Harmony OS、Java、Python等方…...

编程新知 2026/5/13 0:26:23

STM32F103C8T6与DHT11单总线通信：从时序解析到数据校验的实战指南

1. 认识STM32F103C8T6与DHT11这对黄金搭档第一次接触嵌入式开发的朋友可能会觉得，让单片机读取温湿度数据是个复杂的事情。但当你用STM32F103C8T6这颗性价比超高的Cortex-M3内核芯片，搭配DHT11这个经典温湿度传感器时，事情就变得简单多了。…...

编程新知 2026/5/12 23:21:17

谷歌seo如何发布外链？新站首月发布的频率与节奏

域名注册后的前30天，谷歌爬虫会对新站点进行密集的抓取与记录。这个阶段的站点就像一张白纸，每一个外源信号都会被放大记录。很多站长习惯在上线首周就去购买几百条低质链接，试图拉高权重，但这往往会导致站点在沙盒期停留更久。根…...

编程新知 2026/5/12 22:59:02

Codex入门09-Git工作流（小白入门：不会写commit信息？AI帮你自动生成规范提交）

🎯 本文目标学会用 Codex 自动化 Git 操作：提交、冲突解决、PR 描述生成。 😰 Git 新手的典型痛点你的提交记录是不是这样的： git log --oneline a3f4b2c fix 9d1e8c4 update 4c7b91f 修改了一些东西 f0a2d3e 。。。 b5c8e7a 又改了这就是"屎山提交记录"—…...

编程新知 2026/5/12 22:52:45

模拟工程师必备：口袋参考指南的实战价值与核心应用

1. 为什么每个硬件工程师都需要一本“口袋参考书”？前几天整理书桌，翻出来一本2016年从TI官网下载打印的《模拟工程师口袋参考指南》，纸张已经有点发黄，边角也卷了。但就是这么一本薄薄的小册子，从毕业到现在&#xff…...

编程新知 2026/5/12 22:25:22

冻｜结D球 2026

通过网盘分享的文件：冻｜结D球 2026 链接: https://pan.baidu.com/s/1-bhxibfD69ahEoufeQFRRQ?pwdhygv 提取码: hygv...

编程新知 2026/5/12 20:46:38

【限时解密】ElevenLabs未公开的“Voice Stability Index”（VSI）指标解析——专业级语音稳定性评估体系首度披露

更多请点击： https://intelliparadigm.com 第一章：【限时解密】ElevenLabs未公开的“Voice Stability Index”（VSI）指标解析——专业级语音稳定性评估体系首度披露 VSI 的本质与工程意义 Voice Stability Index（VSI&…...

编程新知 2026/5/12 20:44:24

ctf show web入门54

这道题目是 ctf.show 中典型的命令执行（RCE）绕过题。虽然看起来过滤非常严密，但只要理清了它的过滤规则，就能找到生存空间。过滤规则拆解代码通过 preg_match 过滤了以下内容（/i 表示不区分大小写）&…...

编程新知 2026/5/12 19:52:04

STC8H8K64U单片机IAP升级实战：从官方例程到自定义协议的完整移植指南

STC8H8K64U单片机IAP升级实战：从官方例程到自定义协议的完整移植指南在嵌入式系统开发中，固件升级是一个永恒的话题。想象一下这样的场景：你的设备已经部署在客户现场，突然发现了一个需要紧急修复的Bug，或者需要增加新…...

编程新知 2026/5/12 19:45:57

元字符

连接符

限定符

定位符

修饰符（标记）

运算符优先级

普通字符集及其替换

零宽断言

正向先行断言

负向先行断言

正向后发断言

负向后发断言

捕获组

普通捕获组

命名捕获组

PS:非捕获组

相关文章：