Python中正则表达式详解
Python中正则表达式详解
引言
正则表达式是一种用于字符串搜索和操作的强大工具。它使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在Python中,正则表达式通过内置的re模块来实现,使得文本处理变得简洁而高效。
正则表达式基础
在深入了解Python的re模块之前,让我们先了解一些正则表达式的基本概念。
特殊字符
.:匹配除换行符外的任意单个字符。^:匹配输入字符串的开始位置。$:匹配输入字符串的结束位置。*:匹配前面的子表达式零次或多次。+:匹配前面的子表达式一次或多次。?:匹配前面的子表达式零次或一次。
字符集
[abc]:匹配方括号内的任意一个字符。[^abc]:匹配除了方括号内的任意一个字符。[a-z]:匹配任意一个小写字母。
量词
{n}:匹配确定的n次。{n,}:至少匹配n次。{n,m}:最少匹配n次且最多m次。
Python中的re模块
Python的re模块提供了多种函数来处理正则表达式。
基本函数
re.match():从字符串的起始位置匹配一个模式。re.search():搜索字符串,找到第一个匹配的模式。re.findall():找出字符串中所有匹配的模式。re.finditer():返回一个迭代器,每次迭代返回一个Match对象。re.sub():替换字符串中的模式。
编译正则表达式
使用re.compile()函数可以编译一个正则表达式模式,然后使用编译后的模式对象进行匹配。
示例
通过一些具体的示例,我们将展示如何使用re模块。
示例1:提取邮箱地址
场景:在一个文本中,我们需要找到所有的邮箱地址。
import re# 正则表达式模式,用于匹配邮箱
pattern = r'[a-zA-Z0-9_.+]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+'
text = "请联系我们通过email: example@example.com或info@example.org."# 使用findall函数查找所有匹配的邮箱
emails = re.findall(pattern, text)
print(emails) # 输出: ['example@example.com', 'info@example.org']
示例2:替换数字为"数字"
场景:在一段文本中,需要将所有的数字替换为"数字"。
import re# 正则表达式模式,匹配所有的数字
pattern = r'\b[0-9]+\b'
text = "今天天气23度,明天预计会下降到18度。"# 使用sub函数替换所有匹配的数字
new_text = re.sub(pattern, '数字', text)
print(new_text) # 输出: "今天天气数字度,明天预计会下降到数字度。"
示例3:匹配所有大写单词
场景:在一个句子中,我们需要找到所有的大写单词。
import re# 正则表达式模式,匹配以大写字母开头的单词
pattern = re.compile(r'\b[A-Z][a-z]*\b')
text = "Hello World, this is a Test."# 使用findall函数查找所有匹配的大写单词
matches = pattern.findall(text)
print(matches) # 输出: ['Hello', 'World', 'Test']
正则表达式的优化
在使用正则表达式时,我们需要注意一些性能优化的技巧。
使用非贪婪量词
默认情况下,量词是贪婪的,它会尽可能多地匹配字符。使用?可以使其变为非贪婪模式,即尽可能少地匹配字符。
使用原始字符串
在Python中,反斜杠\是一个转义字符。为了避免混淆,使用原始字符串(在字符串前加r)来定义正则表达式。
避免回溯
复杂的正则表达式可能会导致大量的回溯,从而影响性能。尽量避免使用过于复杂的嵌套结构。
使用前瞻和回顾
前瞻(lookahead)和回顾(lookbehind)断言可以用于更精确地匹配文本,但它们可能会增加匹配的复杂度和时间。
预编译正则表达式
如果你需要多次使用同一个正则表达式,使用re.compile()预编译它可以提高效率。
避免捕获组
如果不需要捕获组的内容,使用非捕获组(?:...)来代替常规捕获组(...),这样可以减少内存的使用和提高性能。
结语
正则表达式是一个功能强大的工具,它可以帮助我们高效地处理文本数据。通过Python的re模块,我们可以轻松实现复杂的文本匹配、搜索和替换功能。掌握正则表达式的使用和优化技巧,将大大提高你的开发效率。
相关文章:
Python中正则表达式详解
Python中正则表达式详解 引言 正则表达式是一种用于字符串搜索和操作的强大工具。它使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在Python中,正则表达式通过内置的re模块来实现,使得文本处理变得简洁而高效。 正则表达式基础 在深入…...
vue使用EventBus进行跨组件通信
Vue中的EventBus,又称为事件总线,是一种常用的通信模式,它允许在Vue应用程序的不同组件之间进行松耦合的通信,尤其是对于那些没有直接父子关系的组件间的通信非常有用。EventBus基于Vue的自定义事件系统实现,工作原理遵…...
boot项目中定时任务quartz
最近换项目组,发现项目中定时任务使用的是quartz框架,上一篇文章[springboot定时任务]也是使用的quartz,只不过实现方式不同,于是整理下 定时任务常用方法有Quartz,Spring自带的Schedule框架 Quartz基础知识 quartz…...
使用阿里云OSS实现视频上传功能
目录 前言 视频上传 前言 阿里云对象存储服务(OSS)作为一种高可用、高扩展性的云端存储服务,为开发者提供了便捷、安全的对象存储解决方案。本文将介绍如何利用阿里云OSS实现视频上传功能。 视频上传 前期准备请看阿里云OSS文件上传和下载…...
LOTO示波器软件新增导览功能
新版本的大部分型号LOTO示波器的上位机软件我们改成了导航工具条方式。原来的方式是把所有功能都显示在不同的标签页中,这样的优点是非常快捷方便,基本上用鼠标一两次点击就能直达想要的功能设置。但是缺点是不熟练的客户可能记不住各种功能的标签位置在…...
【StructueEngineering】SYMBOL SCHEDULE
文章目录 标记表列SYMBOL SCHEDULELINES线条COLUMN REFERENCE SYMBOL柱参考标记SECTION REFERENCE SYMBOLS剖面参考标记DETAILREFERENCE SYMBOLS详图参考标记GENERALELEVATIONSYMBOLS一般立面图标记MISCELLANEOUS SYMBOLS杂项标记 STEEL FRAMING SYMBOLS钢结构平面图标记COLUMN…...
简化跨网文件传输摆渡过程,降低IT人员工作量
在当今数字化时代,IT企业面临着日益增长的数据交换需求。随着网络安全威胁的不断演变,网关隔离成为了保护企业内部网络不受外部威胁的重要手段。然而,隔离的同时,企业也需要在不同网络间安全、高效地传输文件,这就催生…...
关于python中屏蔽输出
python中屏蔽输出包含屏蔽标准输出(比如打印出来的内容)、屏蔽标准错误(错误信息)还有屏蔽logging信息等。 屏蔽标准输出 import contextlib import oswith open(os.devnull, "w") as devnull:with contextlib.redire…...
螺旋矩阵(算法题)
文章目录 螺旋矩阵解题思路 螺旋矩阵 给你一个正整数 n ,生成一个包含 1 到 n2 所有元素,且元素按顺时针顺序螺旋排列的 n x n 正方形矩阵 matrix 。 示例 1: 输入:n 3 输出:[[1,2,3],[8,9,4],[7,6,5]]解题思路 模…...
ffmpeg-webrtc(metartc)给ffmpeg添加webrtc协议
这个是使用metrtc的库为ffmpeg添加webrtc传输协议,目前国内还有一个这样的开源项目,是杨成立大佬,大师兄他们在做,不过wili页面维护的不好,新手不知道如何使用,我专门对它做过介绍,另一篇博文&a…...
C语言知识大纲
一、基础 (一)变量定义和使用 (二)数据类型的字节数 (三)变量转换 (四)程序主要结构 (五)if和else判断 (六)switch判断 (七)while循环 (八)do while循环 (九)for循环 (十)基本输入输出 (十一)数组定义和使用 (十二)函数定义和使用 (十三)指针 (十四)多级指针 (十…...
【必会面试题】synchronized锁升级的过程
目录 Java中的synchronized关键字用于实现同步控制,以保护共享资源免受并发访问的影响。为了提高性能,特别是针对多线程环境中的锁机制,Java引入了锁升级的概念。锁升级的过程主要是为了减少锁操作的开销,根据竞争情况动态地调整锁…...
设计模式——工厂三兄弟之简单工厂
1.业务需求 大家好,我是菠菜。在介绍这期简单工厂设计模式前,我们先来看看这样的需求:制作一个简单的计算器,能够实现控制台输入俩个数以及运算符完成运算。 2.初步实现 实现第一版思路: 创建计算器类&…...
如何使用ChatGPT撰写短视频爆款文案
在这个快速发展的数字时代,短视频已经成为最受欢迎的娱乐和信息获取方式之一。对于内容创作者来说,如何制作出爆款短视频,吸引更多观众的注意力,是他们面临的一大挑战。文案,作为视频内容的灵魂,起着至关重…...
申办风景园林设计乙级资质如何整理技术人员的专业培训证明
整理技术人员的专业培训证明是申办风景园林设计乙级资质的重要环节,它直接关系到证明技术人员持续学习和专业能力提升的情况。以下是整理专业培训证明的一些建议步骤: 收集培训记录:首先,向所有参与设计工作的技术人员收集他们参加…...
类别型特征
#机器学习 #深度学习 #基础知识 #特征工程 #数据编码 背景 在现实生活中,我们面对的数据类型有很多,其中有的数据天然为数值类型具备数值意义,那么可以很自然地和算法结合,但是大部分数据他没有天然的数值意义,那么将他们送入到算法前,就需要对数据进行编码处理,将其转换为数…...
java医院管理系统源码(springboot+vue+mysql)
风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于springboot的医院管理系统。项目源码以及部署相关请联系风歌,文末附上联系信息 。 项目简介: 医院管理系统的主要使用者分…...
vue2 面试题
一、.vue的性能优化怎么做? 1.编码优化: 不要把所有的数据都放在data中;v-for时给每个元素绑定事件用事件代理;keep-alive缓存组件;尽可能拆分组件,提高复用性、维护性;key值要保证唯一&#…...
【JavaEE精炼宝库】多线程(3)线程安全 | synchronized
目录 一、线程安全 1.1 经典线程不安全案例: 1.2 线程安全的概念: 1.3 线程不安全的原因: 1.3.1 案例刨析: 1.3.2 线程不安全的名词解释: 1.3.3 Java 内存模型 (JMM): 1.3.4 解决线程不安全问题: 二…...
el-table-column两种方法处理特殊字段,插槽和函数
问题:后端返回的字段为数字 解决办法: {{ row[item.prop] 1 ? "启用" : "禁用" }} {{ row[item.prop] }} 最终果: 另外:如果多种状态时可用函数 {{ getStatus(row[item.prop]) }} {{ row[item.prop…...
2026.5.12【芯片设计面试经验分享】上海车载芯片设计公司
一、主管面试 1、介绍下负责的cpu的九级流水线都有哪级? 指令预取、PC取指、指令译码、发射(双发射)、执行1(alu、运算)、执行2(乘法、移位)、访存、写回、提交/重排 2、负责的spyglass cdc 一般…...
内部举报、纪检谈话等敏感场景,企业沟通工具需要具备哪些安全能力
一家组织处理内部举报时,沟通链路往往比事件本身更敏感。 举报人担心身份暴露,被举报部门担心信息扩散,纪检或内控人员需要核实事实,法务和审计又可能随后介入。一次谈话纪要、一张截图、一份附件、一个会议链接,都可能…...
UE5安装避坑指南:从Launcher到C++编译的完整环境配置
1. 这不是“点下一步就行”的安装:UE5下载安装背后的真实门槛很多人第一次点开Epic Games官网,看到那个醒目的“Download Engine”按钮,下意识觉得:“不就是个游戏引擎安装包?跟装微信、装PS差不多,双击→下…...
卡梅德生物技术快报|噬菌体随机肽库筛选实战:花生过敏原 Ara h 5 模拟表位鉴定全流程
摘要本文面向生物研发、体外诊断、蛋白质工程开发者,系统讲解噬菌体随机肽库筛选过敏原模拟表位完整工程化流程:从问题分析、实验设计、关键参数到结果验证,提供可复现技术方案,基于真实研究数据,聚焦高可靠性表位筛选…...
突破内存瓶颈:HBM、CXL与GPU新部署策略
训练生成式AI模型本身已是一项成本高昂、能耗巨大的工作。随着超大规模数据中心和前沿研究机构竞相扩展边缘推理与智能体AI能力,GPU的部署正变得愈加复杂,尤其是在内存层面。在数据中心中,对先进内存配置的需求日益迫切。不断增多的AI处理器正…...
使用电脑快速测试 PROFINET 设备通讯
Anybus PROFINET主站仿真工具介绍日常对客户进行技术支持的时候,我们发现工厂自动化领域的不同部门不同职能的人员对于工业通讯设备都面临着一些使用的困难,例如设备研发人员,尤其是嵌入式研发部门,对于工厂自动化使用的工业通讯协…...
10分钟掌握XGBoost:机器学习竞赛的终极梯度提升库
10分钟掌握XGBoost:机器学习竞赛的终极梯度提升库 【免费下载链接】xgboost Scalable, Portable and Distributed Gradient Boosting (GBDT, GBRT or GBM) Library, for Python, R, Java, Scala, C and more. Runs on single machine, Hadoop, Spark, Dask, Flink a…...
如何安全提取未知文件:unblob的5大安全防护机制实战指南
如何安全提取未知文件:unblob的5大安全防护机制实战指南 【免费下载链接】unblob Extract files from any kind of container formats 项目地址: https://gitcode.com/gh_mirrors/un/unblob 在数字取证和固件分析工作中,我们经常需要处理来源不明…...
某AI漫剧超级工厂AI绘画与分镜自动化生成流水线详细设计方案(WORD)
导读:随着AIGC技术爆发,传统漫剧生产面临周期长、成本高及风格统一难等痛点,亟需构建工业化生产体系。本项目旨在打造“AI漫剧超级工厂”,通过部署Flux/SDXL大模型,集成LoRA角色微调与分镜自动化设计技术,实…...
九成企业担忧内部系统无法跟上高管薪酬管理需求
• 89%的高级人力资源(HR)、绩效奖励和薪酬负责人表示,企业内部技术无法跟上高管薪酬管理的需求 • 80%的受访者表示,过去三年中参与激励计划的人数有所增加 • 66%的受访者认为,依赖多家服务提供商是保持数据准确性和一致性的主要障碍 对于…...
