当前位置: 首页 > news >正文

Java 正则表达式入门与应用(详细版)

正则表达式(Regular Expression,简称Regex)是一种文本模式匹配工具,在许多编程语言中都得到了广泛应用。Java 作为一种强大的编程语言,提供了对正则表达式的内建支持,使得在字符串处理、数据验证和文本解析等方面的应用变得更加简便。

1. 正则表达式基础

正则表达式是一种描述字符串模式的语言,它可以用来检索、替换和解析文本。正则表达式由字符和特殊符号构成,常见的符号包括:

  • .: 匹配任意单个字符(除换行符外)

  • ^: 匹配字符串的开始

  • $: 匹配字符串的结束

  • *: 匹配前一个字符零次或多次

  • +: 匹配前一个字符一次或多次

  • ?: 匹配前一个字符零次或一次

  • {n}: 匹配前一个字符恰好 n 次

  • []: 字符集合,匹配集合中的任一字符

  • |: 或操作符,匹配两边的任一表达式

  • (): 分组,标记一部分正则表达式,供后续引用

例如,正则表达式 \d+ 可以用来匹配一个或多个数字,而 \b\w+\b 则表示匹配一个单词。

1.1字符类-语法示例:

        1.[abc]:代表a或者b,或者c字符中的一个。

        2.[^abc]:代表除a,b,c以外的任何字符。

        3.[a-z]:代表a-z的所有小写字符中的一个。

        4.[A-Z]:代表A-Z的所有大写字符中的一个。

        5.[0-9]:代表0-9之间的某一个数字字符。

        6.[a-zA-Z0-9]:代表a-z或者A-Z或者0-9之间的任意一个字符。

        7.[a-dm-p]:a 到 d 或 m 到 p之间的任意一个字符。

代码示例;

public class RegexDemo2 {public static void main(String[] args) {//public boolean matches(String regex):判断是否与正则表达式匹配,匹配返回true// 只能是a b cSystem.out.println("-----------1-------------");System.out.println("a".matches("[abc]")); // trueSystem.out.println("z".matches("[abc]")); // false// 不能出现a b cSystem.out.println("-----------2-------------");System.out.println("a".matches("[^abc]")); // falseSystem.out.println("z".matches("[^abc]")); // trueSystem.out.println("zz".matches("[^abc]")); //falseSystem.out.println("zz".matches("[^abc][^abc]")); //true// a到zA到Z(包括头尾的范围)System.out.println("-----------3-------------");System.out.println("a".matches("[a-zA-z]")); // trueSystem.out.println("z".matches("[a-zA-z]")); // trueSystem.out.println("aa".matches("[a-zA-z]"));//falseSystem.out.println("zz".matches("[a-zA-Z]")); //falseSystem.out.println("zz".matches("[a-zA-Z][a-zA-Z]")); //trueSystem.out.println("0".matches("[a-zA-Z]"));//falseSystem.out.println("0".matches("[a-zA-Z0-9]"));//true// [a-d[m-p]] a到d,或m到pSystem.out.println("-----------4-------------");System.out.println("a".matches("[a-d[m-p]]"));//trueSystem.out.println("d".matches("[a-d[m-p]]")); //trueSystem.out.println("m".matches("[a-d[m-p]]")); //trueSystem.out.println("p".matches("[a-d[m-p]]")); //trueSystem.out.println("e".matches("[a-d[m-p]]")); //falseSystem.out.println("0".matches("[a-d[m-p]]")); //false// [a-z&&[def]] a-z和def的交集。为:d,e,fSystem.out.println("----------5------------");System.out.println("a".matches("[a-z&[def]]")); //falseSystem.out.println("d".matches("[a-z&&[def]]")); //trueSystem.out.println("0".matches("[a-z&&[def]]")); //false// [a-z&&[^bc]] a-z和非bc的交集。(等同于[ad-z])System.out.println("-----------6------------_");System.out.println("a".matches("[a-z&&[^bc]]"));//trueSystem.out.println("b".matches("[a-z&&[^bc]]")); //falseSystem.out.println("0".matches("[a-z&&[^bc]]")); //false// [a-z&&[^m-p]] a到z和除了m到p的交集。(等同于[a-1q-z])System.out.println("-----------7-------------");System.out.println("a".matches("[a-z&&[^m-p]]")); //trueSystem.out.println("m".matches("[a-z&&[^m-p]]")); //falseSystem.out.println("0".matches("[a-z&&[^m-p]]")); //false}
}

1.2逻辑运算符-语法示例:

        1.&&:并且

        2.| :或

        3.\ :转义字符

代码示例:

public class Demo {public static void main(String[] args) {String str = "had";//1.要求字符串是小写辅音字符开头,后跟adString regex = "[a-z&&[^aeiou]]ad";System.out.println("1." + str.matches(regex));//2.要求字符串是aeiou中的某个字符开头,后跟adregex = "[a|e|i|o|u]ad";//这种写法相当于:regex = "[aeiou]ad";System.out.println("2." + str.matches(regex));}
}

1.3预定义字符-语法示例:

  1. "." : 匹配任何字符。

  2. "\d":任何数字[0-9]的简写;

  3. "\D":任何非数字[^0-9]的简写;

  4. "\s": 空白字符:[ \t\n\x0B\f\r] 的简写

  5. "\S": 非空白字符:[^\s] 的简写

  6. "\w":单词字符:[a-zA-Z_0-9]的简写

  7. "\W":非单词字符:[^\w] 

代码示例:

public class Demo {public static void main(String[] args) {//.表示任意一个字符System.out.println("你".matches("..")); //falseSystem.out.println("你".matches(".")); //trueSystem.out.println("你a".matches(".."));//true// \\d 表示任意的一个数字// \\d只能是任意的一位数字// 简单来记:两个\表示一个\System.out.println("a".matches("\\d")); // falseSystem.out.println("3".matches("\\d")); // trueSystem.out.println("333".matches("\\d")); // false//\\w只能是一位单词字符[a-zA-Z_0-9]System.out.println("z".matches("\\w")); // trueSystem.out.println("2".matches("\\w")); // trueSystem.out.println("21".matches("\\w")); // falseSystem.out.println("你".matches("\\w"));//false// 非单词字符System.out.println("你".matches("\\W")); // trueSystem.out.println("---------------------------------------------");// 以上正则匹配只能校验单个字符。// 必须是数字 字母 下划线 至少 6位System.out.println("2442fsfsf".matches("\\w{6,}"));//trueSystem.out.println("244f".matches("\\w{6,}"));//false// 必须是数字和字符 必须是4位System.out.println("23dF".matches("[a-zA-Z0-9]{4}"));//trueSystem.out.println("23 F".matches("[a-zA-Z0-9]{4}"));//falseSystem.out.println("23dF".matches("[\\w&&[^_]]{4}"));//trueSystem.out.println("23_F".matches("[\\w&&[^_]]{4}"));//false}
}

1.4数量词-语法示例:

  1. X? : 0次或1次

  2. X* : 0次到多次

  3. X+ : 1次或多次

  4. X{n} : 恰好n次

  5. X{n,} : 至少n次

  6. X{n,m}: n到m次(n和m都是包含的)

代码示例:

public class Demo {public static void main(String[] args) {// 必须是数字 字母 下划线 至少 6位System.out.println("2442fsfsf".matches("\\w{6,}"));//trueSystem.out.println("244f".matches("\\w{6,}"));//false// 必须是数字和字符 必须是4位System.out.println("23dF".matches("[a-zA-Z0-9]{4}"));//trueSystem.out.println("23 F".matches("[a-zA-Z0-9]{4}"));//falseSystem.out.println("23dF".matches("[\\w&&[^_]]{4}"));//trueSystem.out.println("23_F".matches("[\\w&&[^_]]{4}"));//false}
}

2. Java 中如何使用正则表达式

在 Java 中,正则表达式的功能主要通过 java.util.regex 包来实现,特别是 PatternMatcher 类。

2.1 创建 Pattern 对象

Pattern 类是正则表达式的核心,它是用来编译正则表达式并存储的。可以通过 Pattern.compile() 方法来创建一个 Pattern 对象。

Pattern pattern = Pattern.compile("\d+");
2.2 创建 Matcher 对象

Matcher 类则用来执行正则匹配操作。通过 Pattern 对象的 matcher() 方法,可以获得一个 Matcher 对象。

String input = "12345";
Matcher matcher = pattern.matcher(input);
2.3 常见的匹配方法
  • matches(): 判断整个字符串是否与正则表达式匹配

  • find(): 判断字符串中是否包含符合正则的部分

  • group(): 返回匹配的字符串

  • replaceAll(): 替换所有匹配的部分

例如,使用 find() 方法来查找输入字符串中是否包含数字:

if (matcher.find()) {System.out.println("Found a number!");
}

3. Java 正则表达式的常见应用

3.1 数据验证

正则表达式在数据验证中非常有用,例如验证电子邮件地址、电话号码等格式。

// 验证电子邮件格式
Pattern emailPattern = Pattern.compile("^[A-Za-z0-9+_.-]+@[A-Za-z0-9.-]+$");
Matcher emailMatcher = emailPattern.matcher("test@example.com");
if (emailMatcher.matches()) {System.out.println("Valid email!");
} else {System.out.println("Invalid email!");
}
3.2 文本解析

正则表达式也广泛用于从文本中提取信息,例如从日志文件中提取特定的日期、错误信息等。

// 提取日期
Pattern datePattern = Pattern.compile("(\d{4})-(\d{2})-(\d{2})");
Matcher dateMatcher = datePattern.matcher("2023-01-01");
if (dateMatcher.find()) {System.out.println("Year: " + dateMatcher.group(1));System.out.println("Month: " + dateMatcher.group(2));System.out.println("Day: " + dateMatcher.group(3));
}
3.3 字符串替换

正则表达式可以用来对字符串进行复杂的替换操作。

// 替换所有数字为星号
String result = input.replaceAll("\d", "*");

4. 正则表达式的优化与注意事项

虽然正则表达式非常强大,但在实际应用中,正则表达式的性能问题也需要注意。以下是一些优化建议:

  • 尽量避免过于复杂的正则表达式,尤其是涉及回溯的表达式(如使用大量的 .*

  • 使用预编译的 Pattern 对象,避免每次匹配时都重新编译正则表达式

  • 在匹配大量数据时,尝试使用更具体的模式,减少不必要的匹配次数


5. 总结

正则表达式是处理字符串的一个强大工具,尤其在 Java 中,它通过 PatternMatcher 提供了灵活的操作方法。理解并掌握正则表达式的基础语法,以及其常见的应用场景,可以大大提高你的编程效率。通过适当的优化,也能有效避免性能问题。

希望你喜欢这篇文章!请点关注和收藏吧。你的关注和收藏会是我努力更新的动力,祝关注和收藏的帅哥美女们今年都能暴富。如果有更多问题,欢迎随时提问

相关文章:

Java 正则表达式入门与应用(详细版)

正则表达式(Regular Expression,简称Regex)是一种文本模式匹配工具,在许多编程语言中都得到了广泛应用。Java 作为一种强大的编程语言,提供了对正则表达式的内建支持,使得在字符串处理、数据验证和文本解析…...

洛谷:P1540 [NOIP2010 提高组] 机器翻译

[NOIP2010 提高组] 机器翻译 题目背景 NOIP2010 提高组 T1 题目描述 小晨的电脑上安装了一个机器翻译软件,他经常用这个软件来翻译英语文章。 这个翻译软件的原理很简单,它只是从头到尾,依次将每个英文单词用对应的中文含义来替换。对于…...

基于AT89C51单片机的可暂停八路抢答器设计

点击链接获取Keil源码与Project Backups仿真图: https://download.csdn.net/download/qq_64505944/90196607?spm1001.2014.3001.5503 C15 部分参考设计如下: 摘要 随着社会进步和科技发展,电子设备在各类活动中的应用日益普遍&#xff0c…...

面试题解,Java中的“对象”剖析

一、说一说JVM中对象的内存布局?new一个对象到底占多大内存? 话不多说,看下图,对象的内存布局图 一个对象的内存布局主要由三部分组成:对象头(Object Header)、实例数据(Instance D…...

行为模式3.迭代器模式

行为型模式 模板方法模式(Template Method Pattern)命令模式(Command Pattern)迭代器模式(Iterator Pattern)观察者模式(Observer Pattern)中介者模式(Mediator Pattern…...

第8章 DMA控制器

DMA的基本概念 DMA是用硬件实现不再通过CPU的,计算机内存储器与I/O设备之间的直接数据传送技术。该硬件称为DMA控制器(简称DMAC),用来控制数据的输入和输出,复杂性堪比CPU。 DMA方式可实现: 数据存储器RAM→I/O端口的DMA读传送I/O…...

后端java开发路由接口并部署服务器(四)

一、安装IntelliJ IDEA,安装包下载 1、官网下载 2、网盘资源 安装包下载完成后进行傻瓜式下一步安装就可以了 打开IntelliJ IDEA,输入网盘资源文件内容 三、汉化处理 插件搜索chinese,就会找到相应的插件安装重启软件即可 四、新建后端j…...

检索增强生成 和思维链 结合: 如何创建检索增强思维链 (RAT)?

论文地址:https://arxiv.org/pdf/2403.05313 Github地址:https://github.com/CraftJarvis/RAT 想象一下,一个人工智能助手可以像莎士比亚一样写作,像专家一样推理。这听起来很了不起,对吧?但是&#xff0…...

在 SQL 中,区分 聚合列 和 非聚合列(nonaggregated column)

文章目录 1. 什么是聚合列?2. 什么是非聚合列?3. 在 GROUP BY 查询中的非聚合列问题示例解决方案 4. 为什么 only_full_group_by 要求非聚合列出现在 GROUP BY 中?5. 如何判断一个列是聚合列还是非聚合列?6. 总结 在 SQL 中&#…...

单元测试3.0+ @RunWith(JMockit.class)+mock+injectable+Expectations

Jmockit使用笔记_基本功能使用Tested_Injectable_Mocked_Expectations_jmockit.class-CSDN博客 静态变量直接赋值就好,没必要mock了 测试框架Jmockit集合junit使用 RunWith(JMockit.class) 写在测试案例类上的注解 Tested 在测试案例中,写在我们要测试的类上…...

STM32第十一课:STM32-基于标准库的42步进电机的简单IO控制(附电机教程,看到即赚到)

一:步进电机简介 步进电机又称为脉冲电机,简而言之,就是一步一步前进的电机。基于最基本的电磁铁原理,它是一种可以自由回转的电磁铁,其动作原理是依靠气隙磁导的变化来产生电磁转矩,步进电机的角位移量与输入的脉冲个数严格成正…...

MotionCtrl: A Unified and Flexible Motion Controller for Video Generation 论文解读

目录 一、概述 二、相关工作 三、前置知识 1、LVDM Introduction 2、LVDM Method 3、LVDM for Short Video Generation 4、Hierarchical LVDM for Long Video Generation 5、训练细节 6、推理过程 四、MotionCtrl 1、CMCM 2、OMCM 3、训练策略 五、实验 一、概述…...

LINUX线程操作

文章目录 线程的定义LINUX中的线程模型一对一模型多对一模型多对多模型 线程实现原理线程的状态新建状态(New)就绪状态(Runnable)运行状态(Running)阻塞状态(Blocked)死亡状态&#…...

在Lua中,Metatable元表如何操作?

Lua中的Metatable(元表)是一个强大的特性,它允许我们改变表(table)的行为。下面是对Lua中的Metatable元表的详细介绍,包括语法规则和示例。 1.Metatable介绍 Metatable是一个普通的Lua表,它用于…...

4D LUT: Learnable Context-Aware 4D LookupTable for Image Enhancement

摘要:图像增强旨在通过修饰色彩和色调来提高照片的审美视觉质量,是专业数码摄影的必备技术。 近年来,基于深度学习的图像增强算法取得了可喜的性能并越来越受欢迎。 然而,典型的努力尝试为所有像素的颜色转换构建统一的增强器。 它…...

瑞芯微rk3568平台 openwrt系统适配ffmpeg硬件解码(rkmpp)

瑞芯微rk3568平台 openwrt系统适配ffmpeg硬件解码(rkmpp) RK3568及rkmpp介绍编译安装mpp获取源码交叉编译安装 libdrmlibdrm-2.4.89 make 方式编译(cannot find -lcairo, 不推荐)下载源码编译编译错误: multiple definition of `nouveau debug‘错误cannot find -lcairo:…...

使用SuperMap制作地形图的详细教程

一、数据准备 本示例以山东为例,演示如何通过SuperMap iDesktopX制作一个好看的地形图。所有数据均来源于互联网公开数据,如有自己项目真实数据,可直接跳过数据下载进入下一步。 本示例所需数据包括: 数据类别 数据类型 DEM数据…...

PHP Array:精通数组操作

PHP Array:精通数组操作 PHP,作为一门流行的服务器端编程语言,提供了强大的数组处理能力。数组是PHP中非常灵活和强大的数据结构,它可以存储多个相同类型的值。在PHP中,数组不仅可以存储数字,还可以存储字…...

【使用命令配置java环境变量永久生效与脚本切换jdk版本】

java配置环境变量命令与脚本切换jdk版本 新建用户环境变量永久生效 setx JAVA8_HOME "D:\Java\jdk8" setx JAVA17_HOME "d:\Java\jdk-17" setx JAVA_HOME %JAVA8_HOME% setx CLASSPATH ".;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar;"…...

STM32-笔记32-ESP8266作为服务端

esp8266作为服务器的时候,这时候网络助手以客户端的模式连接到esp8266,其中IP地址写的是esp8266作为服务器时的IP地址,可以使用ATCIFSR查询esp8266的ip地址,端口号默认写333。 当esp8266作为服务器的时候,需要完成哪些…...

别再只调参了!从NeurIPS 2025看时间序列预测的7个新思路:标签对齐、隐式解码与后处理修正

别再只调参了!从NeurIPS 2025看时间序列预测的7个新思路:标签对齐、隐式解码与后处理修正 当算法工程师们还在为LSTM的超参数调优争论不休时,NeurIPS 2025的最新研究已经将时间序列预测推向了全新的技术范式。这场全球顶会揭示了一个关键趋势…...

FPGA加速二值化CNN:从MNIST手写识别到硬件优化实践

1. 二值化神经网络与FPGA加速基础 二值化神经网络(BNN)是近年来边缘计算领域的重要突破,它将传统神经网络中的32位浮点权重和激活值压缩到仅用1位表示(1或-1)。这种极端量化带来的直接好处是存储需求降低32倍&#xff…...

leetcode 1540. K次操作转变字符串-耗时95-Can Convert String in K Moves

Problem: 1540. Can Convert String in K Moves 耗时95%&#xff0c;统计差值的余数的频次&#xff0c;相同余数满足等差数列&#xff0c;若不满足【余数 26 * ( 频次 - 1 ) < k】则返回false 最后返回true Code class Solution { public:bool canConvertString(string …...

别急着升级glibc!解决scikit-learn的libgomp内存错误,我更推荐这个方法

生产环境避坑指南&#xff1a;如何优雅解决scikit-learn的libgomp内存分配错误 当你的AI服务突然抛出cannot allocate memory in static TLS block错误时&#xff0c;第一反应可能是升级系统库——但请先放下这个危险的念头。作为经历过三次生产环境崩溃的运维老兵&#xff0c;…...

2步实现格式自由:Save Image as Type让网页图片转换体验升级10倍

2步实现格式自由&#xff1a;Save Image as Type让网页图片转换体验升级10倍 【免费下载链接】Save-Image-as-Type Save Image as Type is an chrome extension which add Save as PNG / JPG / WebP to the context menu of image. 项目地址: https://gitcode.com/gh_mirrors…...

从Level 16到Level 17:Bandit游戏中的SSL端口扫描实战

1. 认识Bandit游戏与Level 16挑战 Bandit游戏是网络安全领域的经典入门实践平台&#xff0c;通过一系列渐进式关卡帮助玩家掌握基础命令行操作和安全概念。从Level 0开始&#xff0c;每个关卡都设计成需要解决特定安全问题才能通关的挑战。这种"做中学"的方式特别适合…...

如何用Chanlun-Pro实现量化缠论交易?终极实战指南

如何用Chanlun-Pro实现量化缠论交易&#xff1f;终极实战指南 【免费下载链接】chanlun-pro 基于缠中说禅所讲缠论理论&#xff0c;以便量化分析市场行情的工具 项目地址: https://gitcode.com/gh_mirrors/ch/chanlun-pro Chanlun-Pro是一款基于缠中说禅理论的量化交易工…...

ROS 之 rosdep 进阶技巧:高效管理workspace依赖关系

1. 从单package到workspace&#xff1a;为什么需要rosdep进阶技巧 刚开始接触ROS的时候&#xff0c;我和大多数开发者一样&#xff0c;每次遇到依赖问题都是手动安装。比如看到Could not find a package configuration file provided by "xxx"这样的错误&#xff0c;…...

Notepad--终极指南:5分钟掌握国产跨平台文本编辑器的完整解决方案

Notepad--终极指南&#xff1a;5分钟掌握国产跨平台文本编辑器的完整解决方案 【免费下载链接】notepad-- 一个支持windows/linux/mac的文本编辑器&#xff0c;目标是做中国人自己的编辑器&#xff0c;来自中国。 项目地址: https://gitcode.com/GitHub_Trending/no/notepad-…...

Python实战:M3FD红外数据集高效转YOLO格式的完整指南

1. 为什么需要转换M3FD数据集格式 红外目标检测在夜间安防、自动驾驶等领域越来越重要&#xff0c;而M3FD作为优质的红外数据集却采用了VOC格式标注。这就像你买了台进口电器&#xff0c;却发现插头不匹配国内插座——虽然东西是好东西&#xff0c;但直接使用会遇到麻烦。 YO…...