当前位置: 首页 > news >正文

Python中使用正则表达式

摘要:

正则表达式,又称为规则表达式,它不是某种编程语言所特有的,而是计算机科学的一个概念,通常被用来检索和替换某些规则的文本。

一.正则表达式的语法

①行定位符

行定位符就是用来描述字符串的边界。"^"表示行的开始,"$"表示行的结束。

^tm    # tm equal Tomorrow Moon可以匹配
tm$    # Tomorrow Moon equal tm可以匹配
tm     # 两者都可以匹配

②元字符

元字符说明
.匹配除换行符以外的任意字符
\w匹配字母、数字、下划线或汉字
\s匹配任意的空白符
\d匹配数字
\b匹配单词的开始或者结束
^匹配字符串的开始
$匹配字符串的结束

③限制符

限定符说明举例
?匹配前面的字符零次或一次colou?r,该表达式可以匹配color和colour
+匹配前面的字符一次或多次go+gle,该表达式可以匹配的范围从gogle到goo...gle
*匹配前面的字符零次或多次go*gle,该表达式可以匹配的范围从ggle到goo...gle
{n}匹配前面的字符n次go{2}gle,该表达式只可匹配google
{n,}匹配前面的字符最少n次go{2,}gle,该表达式可以匹配的范围从google到goo...gle
{n,m}匹配前面的字符最少n次,最多m次employee{0,2},该表达式可以匹配employ、employe和emploee三种情况

④字符类

字符类是一种用于匹配指定字符集中的任意单个字符的模式。字符类被定义在方括号 [] 之内。

  1. 基本字符类

    • [abc]:匹配 "a" 或 "b" 或 "c" 中的任何一个字符。

    • [0-9]:匹配任何数字(等同于 \d)。

  2. 排除字符类

    • [^abc][!abc]:匹配除 "a"、"b" 和 "c" 之外的任何字符。

    • [^0-9]:匹配任何非数字字符(等同于 \D)。

  3. 预定义字符类

    • \d:等同于 [0-9],匹配任何数字。

    • \D:等同于 [^0-9],匹配任何非数字。

    • \w:匹配任何字母数字字符和下划线(等同于 [a-zA-Z0-9_])。

    • \W:匹配任何非字母数字字符和非下划线(等同于 [^a-zA-Z0-9_])。

    • \s:匹配任何空白字符(包括空格、制表符、换页符等)。

    • \S:匹配任何非空白字符。

  4. 特殊字符

    • 如果你想要匹配方括号 [] 本身,需要将它们放在字符类的开头或结尾,或者用反斜杠 \ 转义。

    • 其他特殊字符(如点 .、加号 +、问号 ?、星号 * 等)在字符类中也失去了特殊意义,可以直接使用。

示例

import re
​
text = "The quick brown fox jumps over the lazy dog 123."
pattern = "[a-z]"  # 匹配任何小写字母
​
matches = re.findall(pattern, text)
print(matches)  # 输出所有匹配的小写字母

二.使用re模板实现正则表达式操作

python提供了re模板,用于实现正则表达式的操作。

在使用re模板时,需要先应用import语句将其导入,import re

①匹配字符串

匹配字符串可以使用re模块提供的match()、search()和findall()等方法

(1)match()方法

match()方法用于从字符串的开始处进行匹配,若成功,则返回Match对象,否则返回None。

语法形式:

re.match(pattern,string,[flags])
​

pattern:表示模式字符串,由要匹配的正则表达式转换而来。

string:表示要匹配的字符串。

flags:可选参数,表示标志位,用于控制匹配方式。

标志说明
A或ASCII对于\w、\W、\b、\B、\D、\s和\S只进行ASCII匹配
I或IGNORECASE执行不区分字母大小写的匹配
M或MULTITINE将^和$用于包括整个字符串的开始和结尾的每一行
S或DOTALL使用"."字符匹配所有字符,包括换行符号
X或VERBOSE忽略模式字符串中未转义的空格和注释

示例:

import re
​
pattern = r'mr_\w+'
string = 'MR_SHOP mr_shop'
match = re.match(pattern, string, re.I)
print(match)
string = '项目名称MR_SHOP mr_shop'
match = re.match(pattern, string, re.I)
print(match)

(2)search()方法

search()方法用于在整个字符串中搜索第一个要匹配的值,如果在起始位置匹配成功,则返回Match对象,否则返回None。

语法形式:

re.search(pattern,string,[flags])

示例:

import re
​
pattern = r'mr_\w+'
string = 'MR_SHOP mr_shop'
match = re.search(pattern, string, re.I)
print(match)
string = '项目名称MR_SHOP mr_shop'
match = re.search(pattern, string, re.I)
print(match)

注意:从上述例子可以看出,search()方法不仅仅是在字符串的起始位置处进行搜索,还可以在其他位置处搜索有符合的匹配。

(3)findall()方法

findall()方法用于在整个字符串中搜索所有符合正则表达式的字符串,并以列表的形式返回。如果匹配成功,则返回包含匹配结构的列表,否则返回空列表。

语法形式:

re.findall(pattern,string,[flags])

示例:

import re
​
pattern = r'mr_\w+'
string = 'MR_SHOP mr_shop'
match = re.findall(pattern, string, re.I)
print(match)
string = '项目名称MR_SHOP mr_shop'
match = re.findall(pattern, string)
print(match)
​

②替换字符串

sub()方法用于实现字符串的替换。

语法形式:

re.sub(pattern,repl,string,count,flags)

示例:

import re
​
pattern = r'1[34578]\d{9}'
string = '中奖号码为:84978987 联系电话为:13611111111'
result = re.sub(pattern, '1xxxxxxxxxx', string)
print(result)
 

③使用正则表达式分割字符串

split()方法用于实现根据正则表达式分割字符串,并以列表的形式放回。

语法形式:

re.split(pattern,string,[maxsplit],[flags])
 

示例:

import re
​
pattern = r'[?|&]'
url = 'http://www.baidu.com?username="mr&pwd=mrsoft'
result = re.split(pattern, url)
print(result)

相关文章:

Python中使用正则表达式

摘要: 正则表达式,又称为规则表达式,它不是某种编程语言所特有的,而是计算机科学的一个概念,通常被用来检索和替换某些规则的文本。 一.正则表达式的语法 ①行定位符 行定位符就是用来描述字符串的边界。"^&qu…...

三大口诀不一样的代码,小小的制表符和换行符玩的溜呀

# 小案例,打印输出加法口诀 for i in range(1,10):for j in range(1,10):if j>i:breakprint(f"{j}{i}{ji}".strip(),end\t)print() print(\n) for i in range(1,10):for j in range(1,10):if j>i:breakprint(f"{j}x{i}{j*i}",end\t)print…...

[qt] 线程等待与唤醒

对于生产者与消费者的数据处理的另一种好的解决方法是使用QWaitCondition类,允许线程在一定的条件下唤醒其他多个线程来共同处理。 一 定义公共变量 DataSize: 生产者生产数据的大小BufferSize: 也就是这个缓冲区的大小,每个单元是一个int,也有可能是一个链表,结构…...

Springboot 实现 Modbus Rtu 协议接入物联网设备

Modbus RTU 技术教程 引言 Modbus是一种开放标准的通信协议,它最初由Modicon(现施耐德电气)在1979年发布,旨在让可编程逻辑控制器(PLC)之间能够进行通信。随着时间的发展,Modbus已经成为工业自动化领域中最常用的通信协议之一,尤其适用于连接工业电子设备。本文将详细…...

鸿蒙笔记--装饰器

这一节主要了解一下鸿蒙里的装饰器,装饰器是一种特殊的语法结构,用于装饰类、结构体、方法以及变量; 1 Component在鸿蒙(HarmonyOS)开发中扮演着重要角色,主要用于定义可重用的UI组件,主要作用:1)组件化:Component装饰…...

不同环境下RabbitMQ的安装-3 操作RabbitMQ

前面两篇从不同环境下RabbitMQ的安装-1 为什么要使用消息服务 到同环境下RabbitMQ的安装-2 ARM架构、X86架构、Window系统环境下安装RabbitMQ介绍了关于如何在ARM架构、X86架构和Window系统下如何安装,各位小伙伴可以根据自己的实际开发场景参考安装。 到本篇是一些…...

postgregSQL配置vector插件

1.下载vector 下载vector:https://pgxn.org/dist/vector/0.5.1/ 放在:C:\Program Files\PostgreSQL\vector-0.5.1 2.安装Visual Studio 2022 下载:https://visualstudio.microsoft.com/zh-hans/downloads/ 安装Visual Studio是为了C编译环…...

PUMA论文阅读

PUMA: Efficient Continual Graph Learning with Graph Condensation PUMA:通过图压缩进行高效的连续图学习 ABSTRACT 在处理流图时,现有的图表示学习模型会遇到灾难性的遗忘问题,当使用新传入的图进行学习时,先前学习的这些模…...

算法学习day31(动态规划)

一、比特位计数 给你一个整数 n &#xff0c;对于 0 < i < n 中的每个 i &#xff0c;计算其二进制表示中 1 的个数 &#xff0c;返回一个长度为 n 1 的数组 ans 作为答案。 输入&#xff1a;n 2 输出&#xff1a;[0,1,1] 解释&#xff1a;0 --> 0 1 --> 1 2 -…...

嵌入式学Day25---Linux软件编程---线程间通信

目录 ​编辑 一、线程的分离属性 1.1.什么是分离属性 1.2.分离属性相关函数接口 1.初始化线程属性-pthread_attr_init() 2.销毁线程属性-pthread_attr_destory() 3.设置线程属性-pthread_setdetachstate() 1.3.注意 二、互斥锁 2.1.资源 2.2.互斥锁 1.什么是互斥锁 2.互…...

【实现100个unity特效之17】在unity中使用shader和ShaderGraph分别实现模糊特定层,高斯模糊效果

最终效果 Unity通过Shader来模糊场景画面 参考&#xff1a;【游戏开发小技】Unity通过UI全屏图来模糊场景画面&#xff08;Shader | 模糊 | 滤镜 | Blur&#xff09; ShaderGraph实现图片的高斯模糊 参考&#xff1a;【游戏开发实战】Unity ShaderGraph实现图片的高斯模糊效…...

Unity补完计划 之 SpriteEditer Multiple

本文仅作笔记学习和分享&#xff0c;不用做任何商业用途 本文包括但不限于unity官方手册&#xff0c;unity唐老狮等教程知识&#xff0c;如有不足还请斧正 1. SpriteEditer Multiple Automatic slicing - Unity 手册 这是用于裁剪图集的模式 应用之后精灵编辑器会看到Slice亮…...

C++ IOStream

IOStream 类流特性 不可赋值和复制缓冲重载了<< >> 状态位 示例 状态位操作函数coutcin getget(s,n)/get(s,n,d):getline otherif(!fs)/while(cin) operator void*()与 operator!()代码示例 File Stream open 函数 文件打开方式 文件读写 读写接口 一次读一个字符…...

2024/8/8训练

A - 无线网络整点栅格统计 题目链接 算法:模拟 题目大意 给你一个n*m的网格,然后输出每一个点作为顶点能构成的正方形数量(可以为斜正方形). 算法思路 本身题目数据是很小的,可以通过n^2的时间复杂度枚举每一个顶点,然后再通过n平方的时间复杂度枚举出另一个对角顶点,判断…...

项目的小结

项目场景&#xff1a; 作业的发布&#xff0c;打回 。 学生端做作业 由作业的state来确定作业是否上交&#xff0c;批改&#xff0c;打回作业。 实体类的建立&#xff0c;还有各种成员变量的设计要满足需求 问题描述 问题&#xff1a; 在进行上传作业后&#xff0c;老师端…...

【目标检测实验系列】YOLOv5高效涨点:基于NAMAttention规范化注意力模块,调整权重因子关注有效特征(文内附源码)

1. 文章主要内容 本篇博客主要涉及规范化注意力机制&#xff0c;融合到YOLOv5(v6.1版本&#xff0c;去掉了Focus模块)模型中&#xff0c;通过惩罚机制&#xff0c;调整特征权重因子&#xff0c;使模型更加关注有效特征&#xff0c;助力模型涨点。 2. 简要概括 论文地址&#x…...

LSPatch制作内置模块应用软件无需root 教你制作内置应用

前言 LSPatch功能非常强大&#xff0c;它是一款基于LSPosed核心的免Root Xposed框架软件。这意味着用户无需进行手机root操作&#xff0c;即可轻松植入内置Xposed模块&#xff0c;享受更多定制化的功能和体验&#xff0c;比如微某内置模块版等&#xff0c;这为那些不想root手机…...

Java设计模式七大原则

本篇为七大原则概述&#xff0c;后面会有每个原则的介绍&#xff0c;喜欢的朋友可以蹲一下哦&#xff01;&#xff01;&#xff01;&#xff01; Java设计模式的七大原则一般是指“面向对象设计原则”&#xff0c;这些原则有助于在设计软件系统时提高代码的可维护性、可扩展性和…...

Copy as cURL 字段含义

当前端在开发过程中&#xff0c;遇到接口错误反馈给后端人员时&#xff0c;一般在此接口处右键复制为cURL。 格式如下&#xff1a; curl https://xxx.xxx.cn/xxx/xxx/management/record/list \-H accept: application/json, text/plain, */* \-H accept-language: zh-CN,zh;q0…...

mysql更改密码后,若依 后端启动不了解决方案

我原先的mysql 密码是 数字字符串 我想改成000 纯数字 改完之后&#xff0c;连接的数据库的代码 也更改后 &#xff0c;后端启动不了 因为原先 密码数字字符串 不需要用引号" " 括起来 我改成纯数字 需要用 " " 括起来 如下图 然后就可以运行成功了...

3天掌握Agent架构从设计到生产环境部署实战

3天掌握Agent架构从设计到生产环境部署实战 随着大语言模型技术的普及&#xff0c;单纯的模型调用已无法满足复杂业务场景的需求——企业需要能自主规划任务、调用工具、迭代执行的智能系统&#xff0c;Agent架构正是解决这一痛点的核心方案。本文将以3天为周期&#xff0c;从原…...

在瑞芯微RK3568上,用Qt5+EGL实现零拷贝离屏渲染的完整避坑指南

瑞芯微RK3568嵌入式平台Qt5EGL零拷贝渲染实战解析 引言&#xff1a;嵌入式图形开发的性能瓶颈与突破 在瑞芯微RK3568这类嵌入式平台上开发图形应用时&#xff0c;开发者常常面临一个核心矛盾&#xff1a;既要满足复杂UI渲染的功能需求&#xff0c;又要兼顾有限的硬件资源。传统…...

MapAnything:从“万能钥匙”到“度量之眼”,Transformer如何重塑3D重建的统一范式

1. MapAnything&#xff1a;一把打开3D世界的万能钥匙 想象一下&#xff0c;你手里有一把能打开所有门的钥匙——无论是家里的防盗门、办公室的玻璃门&#xff0c;还是保险柜的金属门。在3D重建领域&#xff0c;MapAnything就是这把"万能钥匙"。传统3D重建就像需要携…...

14 - SVM的用户态API接口

难度: 🟡🔴 中级 预计学习时间: 2小时 前置知识: 第4章(核心数据结构)、第6章(范围管理) 📋 概述 SVM(Shared Virtual Memory)的用户态接口是上层框架(ROCm runtime、HSA runtime)与内核驱动之间的唯一公开契约。整个SVM用户态API只有一个IOCTL命令 AMDKFD_IOC_…...

盘姬工具箱实用工具推荐:从文件恢复到批量重命名

在盘姬工具箱的众多功能中&#xff0c;有一些工具特别值得推荐。 这些工具都能切实解决用户在日常使用电脑过程中遇到的各种问题。 而且这些工具的操作都非常简单直观&#xff0c;不需要用户具备专业的技术知识。 无论是电脑新手还是资深用户&#xff0c;都能通过这些工具获…...

OpenClaw技能市场巡礼:Top10 SecGPT-14B相关安全自动化模块

OpenClaw技能市场巡礼&#xff1a;Top10 SecGPT-14B相关安全自动化模块 1. 为什么需要安全自动化模块&#xff1f; 去年处理服务器日志时&#xff0c;我发现自己每天要重复执行相同的命令&#xff1a;grep筛选关键错误、awk提取时间戳、手动比对不同节点的告警时间差。这种重…...

跨境电商利器:OpenClaw+Phi-3-vision-128k-instruct自动翻译商品图片

跨境电商利器&#xff1a;OpenClawPhi-3-vision-128k-instruct自动翻译商品图片 1. 为什么需要自动化图片翻译 作为跨境电商卖家&#xff0c;我每天都要处理大量商品图片的翻译工作。传统流程需要人工截图、翻译、PS替换文字、再导出图片&#xff0c;整个过程耗时耗力。一张简…...

Labview下的ADC参数测试上位机软件:动态与静态参数计算及波形显示

ADC参数测试上位机&#xff0c;通过将ADC的数字量输入上位机&#xff0c;上位机可以计算出动态参数 ENOB SFDR SNR 总谐波失真 以及静态参数 DNL和INL等参数。 其中动态参数的计算以及时序和频域的波形显示均采用matlab模块计算。 使用labview编写隔壁工位的张工最近快被ADC测…...

数学周刊第14期(2026年03月30日-04月06日)中国数学家王虹再获殊荣

目录王虹获纽约大学最高荣誉&#xff0c;距菲尔兹奖仅一步之遥香港科大团队首创代码驱动系统参考资料王虹获纽约大学最高荣誉&#xff0c;距菲尔兹奖仅一步之遥 当地时间4月2日&#xff0c;美国纽约大学柯朗数学科学研究所宣布&#xff0c;中国数学家王虹获评该校“银教授”&am…...

Figma

Figma 是一款基于浏览器的界面设计工具&#xff0c;现在已经成为UI/UX设计领域的事实标准。核心定位维度说明本质云端协作式界面设计工具主战场UI设计、UX原型、设计系统管理最大差异化实时多人协作&#xff08;像Google Docs一样多人同时编辑&#xff09; 关键特性 1. 实时协作…...