当前位置: 首页 > news >正文

正则表达式——参考视频B站《奇乐编程学院》

智能指针

  • 一、背景
    • 🎈1.1. 模式匹配
    • 🎈1.2. 文本替换
    • 🎈1.3. 数据验证
    • 🎈1.4. 信息提取
    • 🎈1.5. 拆分字符串
    • 🎈1.6. 高级搜索功能
  • 二、原料
    • 2.1 参考视频
    • 2.2 验证网址
  • 三、用法
    • 3.1 限定符
      • 3.1.1 ?
      • 3.1.2 *
      • 3.1.3 +
      • 3.1.4 {}
      • 3.1.4 ()
    • 3.2 "或"运算符
    • 3.3 字符类
      • 3.3.1 []
      • 3.3.2 ^
    • 3.3 特殊字符
      • 3.3.1 一般特殊
      • 3.3.2 二般特殊
  • 四、高级用法
    • 4.1 贪婪与懒惰匹配
  • 五、实例
    • 5.1 匹配rgb颜色
    • 5.2 匹配IPV4
  • 六、总结
    • 6.1 评论区总结
    • 6.2 视频总结

一、背景

正则表达式是一个非常灵活且功能强大的工具,可用于各种文本处理和数据操作任务。无论是在编程中还是在日常文本编辑中,掌握正则表达式都能显著提高效率和准确性。正则表达式(Regular Expression,简称 regex or regexp) 是一种用于匹配和操作字符串的强大工具。它可以用于多种编程语言和工具中,广泛应用于文本处理、数据验证、信息提取等任务。以下是正则表达式的一些主要作用:

🎈1.1. 模式匹配

正则表达式可以帮助你查找特定模式的文本。例如,你可以找到所有以 “abc” 开头的字符串,或是匹配任何包含数字的字符串。

🎈1.2. 文本替换

你可以使用正则表达式在文本中进行替换操作。例如,可以将所有的邮箱地址替换为一个统一格式,或者移除特定模式的字符串。

🎈1.3. 数据验证

正则表达式常用于验证输入数据的格式,例如验证电子邮件地址、电话号码、日期格式等。这可以确保用户输入的内容符合预期格式。

🎈1.4. 信息提取

利用正则表达式可以从文本中提取特定的信息。例如,从日志文件中提取日期、事件代码或任何特定模式的信息。

🎈1.5. 拆分字符串

使用正则表达式可以根据特定模式拆分字符串,例如,将一段文本按空格、标点符号等分割开来。

🎈1.6. 高级搜索功能

在一些文本编辑器或 IDE 中,正则表达式提供了强大的搜索功能,允许用户使用复杂的模式来查找文本。

二、原料

2.1 参考视频

【10分钟快速掌握正则表达式】 https://www.bilibili.com/video/BV1da4y1p7iZ/?share_source=copy_web&vd_source=e52fceea42b773b494141fae690ef6c5

2.2 验证网址

https://regex101.com/

三、用法

万事俱备,我们直接切入正题

3.1 限定符

3.1.1 ?

测试实例:use a used variable name is illegal.
表达式: used?
意义表示: 字符d这个词出现0次或1次

在这里插入图片描述

3.1.2 *

测试实例:

ac
abc
abbbbbbc
adc
addddddc

表达式: ab*c
意义表示: 代表b可以没有也可以出现多次
在这里插入图片描述

3.1.3 +

测试实例:

ac
abc
abbbbbbc
adc
addddddc

表达式: ab+c
意义表示: 代表b可出现一次以上字符
在这里插入图片描述

3.1.4 {}

测试实例:

abc
abbc
abbbbbbbbbc
abbbbbbc
ac
adc
addddddc

表达式: ab{2}c
意义表示: 代表b可出现2次
在这里插入图片描述

表达式:

 ab{2,6}c

意义表示: 代表b可出现2次到6次字符
在这里插入图片描述
表达式:

ab{2,}c

意义表示: 代表b可出现2次以上
在这里插入图片描述

3.1.4 ()

前面我们涉及的都是一个字符,如果我们需要匹配两个字符,可以通过()括起来
表达式:

a(bb){1,3}c

意义表示: 代表bb可出现1次到3次字符
在这里插入图片描述

3.2 "或"运算符

测试实例:

a cat
a dog
a bird

表达式: a (cat|dog)
意义表示: 先匹配a (空格)然后后面要么是dog要么是cat
在这里插入图片描述

3.3 字符类

3.3.1 []

测试实例:`

abc
tiger
aabbcc
dog

表达式: [abc]+
意义表示: 匹配由字母abc构成的字母的单词,方括号里的内容代表要求匹配的字符只能取自于它们
在这里插入图片描述

3.3.2 ^

测试实例:

abc
tiger
aabbcc
dog
1234678
abc123456
ABCDEFG

表达式: [^1-9]+
意义表示: 匹配数字字符,匹配除了^号后面的字符的字符
在这里插入图片描述

3.3 特殊字符

3.3.1 一般特殊

\d :匹配任何数字,相当于 [0-9]\D :匹配任何非数字字符,相当于 [^0-9]\w :匹配任何单词字符(字母、数字或下划线),相当于 [a-zA-Z0-9_]\W :匹配任何非单词字符,相当于 [^a-zA-Z0-9_]\s :匹配任何空白字符(空格、制表符、换行符等)。
\S :匹配任何非空白字符。
.:表示任意字符,但是不包括换行符

3.3.2 二般特殊

^ :匹配输入字符串的开始位置。
例子:^abc 仅匹配以 abc 开头的字符串。$ :匹配输入字符串的结束位置。
例子:abc$ 仅匹配以 abc 结尾的字符串

四、高级用法

4.1 贪婪与懒惰匹配

<span><b>This is a sample text</b></span>

表达式:<.+?>
意义: 它会将正则表达式中的默认的贪婪匹配切换为懒惰匹配
解析:

 <.+?>
<:匹配字符 <,表示开始一个标签。
.:匹配任意单个字符(除了换行符)。这意味着这个正则表达式会匹配标签内的任意字符。
+:表示前面的字符(在本例中是 .)出现一次或多次。因此,.+ 会匹配一个或多个任意字符。
?:在这里是一个惰性量词(lazy quantifier)。将 ? 放在 + 后面,使得正则表达式匹配尽可能少的字符即可(即最小匹配)。因此,.+? 会匹配至少一个字符,但会尽可能少地匹配,以便找到整个模式的结束部分。
>:匹配字符 >,表示结束一个标签。

五、实例

5.1 匹配rgb颜色

#00
#ffffff
#ffaaff
#00hh80
#aabbcc
#000000
#ffffffff

匹配字符串:

#[a-fA-F0-9]{6}\b

其中\b是单词字符的边界,用来去掉最后一个#ffffffff

5.2 匹配IPV4

123
255.255.255.0
192.168.0.1
0.0.0.0
256.1.1.1
This is a string.
123.123.0

匹配字符串:

复杂还没搞懂

六、总结

6.1 评论区总结

来自评论区《喝酸奶的一颗竹子》

匹配符:
d? d出现0/1次
a* a可以出现0/多次
a+ a出现一次以上
a{6} a出现6次
a{2,} a出现2次以上
a{2,6} a出现2-6次
匹配多个字符:
(ab)+ ab出现一次以上
或运算:
a (cat|dog) 匹配 a cat or a dog
a cat|dog 匹配 a cat or dog
字符类:
匹配由abc构成的数据【abc】+ abc出现一次以上 abc aabbcc
【a-zA-Z0-9】 ABCabc123
^ 排除 【^0-9】 匹配0-9之外的数据(包括换行符)
元字符
\d 数字字符 \d+ 匹配一个以上的数字
\D 非数字字符
\w 单词字符 单词 数字 下划线即英文字符
\W 非单词字符
\s 空白符 包含空格和换行符
\S 非空白字符
\b 单词的边界 单词的开头或结尾 单词与符号之前的边界
\B 非单词的边界 符号与符号 单词与单词的边界
. 任意字符不包含换行符
\. 表示. 通过\进行了转意
^ 匹配行首 $ 匹配行尾
*+{}贪婪匹配
<strong><b>https://www.wondershare. com</strong></b>
<.+> 会匹配整串 因为是贪婪匹配
<.+?> 只匹配两个标签代码,+? 设置为懒惰匹配

6.2 视频总结

在这里插入图片描述

相关文章:

正则表达式——参考视频B站《奇乐编程学院》

智能指针 一、背景&#x1f388;1.1. 模式匹配&#x1f388;1.2. 文本替换&#x1f388;1.3. 数据验证&#x1f388;1.4. 信息提取&#x1f388;1.5. 拆分字符串&#x1f388;1.6. 高级搜索功能 二、原料2.1 参考视频2.2 验证网址 三、用法3.1 限定符3.1.1 ?3.1.2 *3.1.3 3.1.…...

【FFmpeg】FFmpeg 内存结构 ⑥ ( 搭建开发环境 | AVPacket 创建与释放代码分析 | AVPacket 内存使用注意事项 )

文章目录 一、搭建开发环境1、开发环境搭建参考2、项目搭建 二、AVPacket 创建与释放代码分析1、AVPacket 创建与释放代码2、Qt 单步调试方法3、单步调试 - 分析 AVPacket 创建与销毁代码 三、AVPacket 内存使用注意事项1、谨慎使用 av_init_packet 函数2、av_init_packet 函数…...

【多模态文档智能】OCR-free感知多模态大模型技术链路及训练数据细节

目前的一些多模态大模型的工作倾向于使用MLLM进行推理任务&#xff0c;然而&#xff0c;纯OCR任务偏向于模型的感知能力&#xff0c;对于文档场景&#xff0c;由于文字密度较高&#xff0c;现有方法往往通过增加图像token的数量来提升性能。这种策略在增加新的语言时&#xff0…...

Mybatis动态sql执行过程

动态SQL的执行原理主要涉及到在运行时根据条件动态地生成SQL语句&#xff0c;然后将其发送给数据库执行。以下是动态SQL执行原理的详细解释&#xff1a; 一、接收参数 动态SQL首先会根据用户的输入或系统的条件接收参数。这些参数可以是查询条件、更新数据等&#xff0c;它们…...

leetcode 31 Next Permutation

题意 找到下一个permutation是什么&#xff0c;对于一个数组[1&#xff0c;2&#xff0c;3]&#xff0c;下一个排列就是[1, 3, 2] 链接 https://leetcode.com/problems/next-permutation/ 思考 首先任何一个permutation满足一个性质&#xff0c;从某个位置往后一定是降序。…...

每日一练 | 华为 eSight 创建的缺省角色

01 真题题目 下列选项中&#xff0c;不属于华为 eSight 创建的缺省角色的是&#xff1a; A. Administrator B. Monitor C. Operator D. End-User 02 真题答案 D 03 答案解析 华为 eSight 是一款综合性的网络管理平台&#xff0c;提供了多种管理和监控功能。 为了确保不同用…...

PyTorch基本使用-自动微分模块

学习目的&#xff1a;掌握自动微分模块的使用 训练神经网络时&#xff0c;最常用的算法就是反向传播。在该算法中&#xff0c;参数&#xff08;模型权重&#xff09;会根据损失函数关于对应参数的梯度进行调整。为了计算这些梯度&#xff0c;PyTorch 内置了名为 torch.autogra…...

libevent-Reactor设计模式【1】

一、Libevent概述 1、简介 Libevent 是一个用C语言编写的、轻量级的开源高性能事件通知库&#xff0c;主要有以下几个亮点&#xff1a;事件驱动&#xff08; event-driven&#xff09;&#xff0c;高性能;轻量级&#xff0c;专注于网络&#xff0c;不如 ACE 那么臃肿庞大&#…...

奇奇怪怪的错误-Tag和space不兼容

报错信息如下&#xff1a; TabError: inconsistent use of tabs and spaces in indentation make: *** [Makefile:24: train] Error 1不能按Tab&#xff0c;要老老实实按space 不过可以在编辑器里面改&#xff0c;把它们调整成一致的&#xff1b;...

29.攻防世界ics-06

ics-06 难度&#xff1a;1 方向&#xff1a;Web 题目描述: 云平台报表中心收集了设备管理基础服务的数据&#xff0c;但是数据被删除了&#xff0c;只有一处留下了入侵者的痕迹。 进入靶场 发现有一处能点动 多了个id1 我其实尝试改过id数&#xff0c;不过没什么变化&#xf…...

强化学习路径规划:基于SARSA算法的移动机器人路径规划,可以更改地图大小及起始点,可以自定义障碍物,MATLAB代码

一、SARSA算法概述 SARSA&#xff08;State-Action-Reward-State-Action&#xff09;是一种在线强化学习算法&#xff0c;用于解决决策问题&#xff0c;特别是在部分可观测的马尔可夫决策过程&#xff08;POMDPs&#xff09;中。SARSA算法的核心思想是通过与环境的交互来学习一…...

【MFC】如何读取rtf文件并进行展示

tf是微软的一个带格式的文件&#xff0c;比word简单&#xff0c;我们可以用写字板等程序打开编辑。下面以具体实例讲解如何在自己程序中展示rtf文件。 首先使用VS2022创建一个MFC的工程。 VIEW类需要选择richview类&#xff0c;用于展示&#xff0c;如下图&#xff1a; 运行效…...

Vulhub:Log4j[漏洞复现]

CVE-2017-5645(Log4j反序列化) 启动靶场环境 docker-compose up -d 靶机IPV4地址 ifconfig | grep eth0 -A 5 ┌──(root㉿kali)-[/home/kali/Desktop/temp] └─# ifconfig | grep eth0 -A 5 eth0: flags4163<UP,BROADCAST,RUNNING,MULTICAST> mtu 1500 in…...

面向预测性维护的TinyML技术栈全面综述

论文标题&#xff1a;A Holistic Review of the TinyML Stack for Predictive Maintenance&#xff08;面向预测性维护的TinyML技术栈全面综述&#xff09; 作者信息&#xff1a;Emil Njor, Mohammad Amin Hasanpour, Jan Madsen, Xenofon Fafoutis&#xff0c;均来自丹麦技术…...

沈阳理工大学《2024年811自动控制原理真题》 (完整版)

本文内容&#xff0c;全部选自自动化考研联盟的&#xff1a;《沈阳理工大学811自控考研资料》的真题篇。后续会持续更新更多学校&#xff0c;更多年份的真题&#xff0c;记得关注哦~ 目录 2024年真题 Part1&#xff1a;2024年完整版真题 2024年真题...

用前端html如何实现2024烟花效果

用HTML、CSS和JavaScript编写的网页&#xff0c;主要用于展示“2024新年快乐&#xff01;”的文字形式烟花效果。下面是对代码主要部分的分析&#xff1a; HTML结构 包含三个<canvas>元素&#xff0c;用于绘制动画。引入百度统计的脚本。 CSS样式 设置body的背景为黑…...

Redis应用-在用户数据里的应用

1.社区电商的业务闭环 接下来介绍的社区电商是以Redis作为主体技术、以MySQL和RocketMQ作为辅助技术实现的。 (1)社区电商运作模式 社区电商的关键点在于社区,而电商则是辅助性质(次要地位,流量变现)。社区可以分成很多种社区,比如美食社区、美妆社区、影评社区、妈妈社区…...

C++ 中面向对象编程如实现数据隐藏

在C中&#xff0c;面向对象编程&#xff08;OOP&#xff09;通过封装&#xff08;Encapsulation&#xff09;来实现数据隐藏。封装是OOP的一个核心概念&#xff0c;它允许将对象的属性和行为&#xff08;即数据和方法&#xff09;组合在一起&#xff0c;并对外隐藏对象的内部实…...

JavaEE 【知识改变命运】04 多线程(3)

文章目录 多线程带来的风险-线程安全线程不安全的举例分析产出线程安全的原因&#xff1a;1.线程是抢占式的2. 多线程修改同一个变量&#xff08;程序的要求&#xff09;3. 原子性4. 内存可见性5. 指令重排序 总结线程安全问题产生的原因解决线程安全问题1. synchronized关键字…...

gz中生成模型

生成模型 通过服务调用生成 还记得parameter_bridge 吗&#xff1f; 我们在生成桥接的时候调用了这个cpp文件。 一个 parameter_bridge 实例用于消息传递&#xff08;传感器数据&#xff09;。之前的例子 另一个 parameter_bridge 实例用于服务桥接&#xff08;动态生成模型…...

VB.net复制Ntag213卡写入UID

本示例使用的发卡器&#xff1a;https://item.taobao.com/item.htm?ftt&id615391857885 一、读取旧Ntag卡的UID和数据 Private Sub Button15_Click(sender As Object, e As EventArgs) Handles Button15.Click轻松读卡技术支持:网站:Dim i, j As IntegerDim cardidhex, …...

遍历 Map 类型集合的方法汇总

1 方法一 先用方法 keySet() 获取集合中的所有键。再通过 gey(key) 方法用对应键获取值 import java.util.HashMap; import java.util.Set;public class Test {public static void main(String[] args) {HashMap hashMap new HashMap();hashMap.put("语文",99);has…...

电脑插入多块移动硬盘后经常出现卡顿和蓝屏

当电脑在插入多块移动硬盘后频繁出现卡顿和蓝屏问题时&#xff0c;可能涉及硬件资源冲突、驱动兼容性、供电不足或系统设置等多方面原因。以下是逐步排查和解决方案&#xff1a; 1. 检查电源供电问题 问题原因&#xff1a;多块移动硬盘同时运行可能导致USB接口供电不足&#x…...

[ICLR 2022]How Much Can CLIP Benefit Vision-and-Language Tasks?

论文网址&#xff1a;pdf 英文是纯手打的&#xff01;论文原文的summarizing and paraphrasing。可能会出现难以避免的拼写错误和语法错误&#xff0c;若有发现欢迎评论指正&#xff01;文章偏向于笔记&#xff0c;谨慎食用 目录 1. 心得 2. 论文逐段精读 2.1. Abstract 2…...

React19源码系列之 事件插件系统

事件类别 事件类型 定义 文档 Event Event 接口表示在 EventTarget 上出现的事件。 Event - Web API | MDN UIEvent UIEvent 接口表示简单的用户界面事件。 UIEvent - Web API | MDN KeyboardEvent KeyboardEvent 对象描述了用户与键盘的交互。 KeyboardEvent - Web…...

BCS 2025|百度副总裁陈洋:智能体在安全领域的应用实践

6月5日&#xff0c;2025全球数字经济大会数字安全主论坛暨北京网络安全大会在国家会议中心隆重开幕。百度副总裁陈洋受邀出席&#xff0c;并作《智能体在安全领域的应用实践》主题演讲&#xff0c;分享了在智能体在安全领域的突破性实践。他指出&#xff0c;百度通过将安全能力…...

《基于Apache Flink的流处理》笔记

思维导图 1-3 章 4-7章 8-11 章 参考资料 源码&#xff1a; https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...

力扣-35.搜索插入位置

题目描述 给定一个排序数组和一个目标值&#xff0c;在数组中找到目标值&#xff0c;并返回其索引。如果目标值不存在于数组中&#xff0c;返回它将会被按顺序插入的位置。 请必须使用时间复杂度为 O(log n) 的算法。 class Solution {public int searchInsert(int[] nums, …...

sipsak:SIP瑞士军刀!全参数详细教程!Kali Linux教程!

简介 sipsak 是一个面向会话初始协议 (SIP) 应用程序开发人员和管理员的小型命令行工具。它可以用于对 SIP 应用程序和设备进行一些简单的测试。 sipsak 是一款 SIP 压力和诊断实用程序。它通过 sip-uri 向服务器发送 SIP 请求&#xff0c;并检查收到的响应。它以以下模式之一…...

#Uniapp篇:chrome调试unapp适配

chrome调试设备----使用Android模拟机开发调试移动端页面 Chrome://inspect/#devices MuMu模拟器Edge浏览器&#xff1a;Android原生APP嵌入的H5页面元素定位 chrome://inspect/#devices uniapp单位适配 根路径下 postcss.config.js 需要装这些插件 “postcss”: “^8.5.…...