C++ 正则表达式分组捕获入门指南
在 C++ 中,正则表达式(regex)是一种用于匹配字符串模式的强大工具。正则表达式不仅能帮助你查找符合特定模式的字符,还能捕获匹配的子字符串(即分组捕获)。这篇文章将介绍 C++ 正则表达式中的分组捕获机制,并提供多个示例代码来帮助你快速入门。
一、基本概念:正则表达式分组捕获
正则表达式分组捕获是一种能够将匹配的部分提取出来的技术。在 C++ 中,正则表达式分组捕获通常通过小括号 () 来实现。每个分组会捕获匹配到的子字符串,并且可以在代码中通过相应的索引访问它们。
分组的基本语法
():用于定义捕获分组。你可以在正则表达式中使用多个分组,C++ 中从1开始对分组编号。
示例:简单分组捕获
假设我们需要从一个日期字符串中提取年月日,可以使用正则表达式中的分组捕获来实现。
二、C++ 正则表达式库:<regex>
在 C++ 中使用正则表达式时,需要包含头文件 <regex>。基本的正则表达式操作包括:
std::regex:正则表达式对象。std::smatch:保存匹配结果的对象。std::regex_search:查找匹配。std::regex_match:完全匹配整个字符串。std::regex_replace:替换匹配的字符串。
三、示例代码:日期分组捕获
我们可以编写一个示例程序,从一个字符串中提取出日期的年、月和日。
示例 1:提取日期(YYYY-MM-DD)
假设我们有一个日期字符串 2023-02-25,并希望通过正则表达式捕获出年、月、日。
#include <iostream>
#include <regex>
#include <string>int main() {std::string input = "2023-02-25";// 正则表达式:捕获年、月和日std::regex pattern(R"((\d{4})-(\d{2})-(\d{2}))");std::smatch matches;// 如果匹配成功if (std::regex_match(input, matches, pattern)) {// 输出捕获的各个分组std::cout << "Year: " << matches[1] << std::endl;std::cout << "Month: " << matches[2] << std::endl;std::cout << "Day: " << matches[3] << std::endl;} else {std::cout << "No match found." << std::endl;}return 0;
}
代码解析:
-
正则表达式
R"((\d{4})-(\d{2})-(\d{2}))":
(\d{4})捕获4位数字(即年份)。(\d{2})捕获2位数字(即月份和日期)。
-
matches[1]、matches[2]、matches[3]分别存储匹配到的年份、月份和日期。
输出:
Year: 2023
Month: 02
Day: 25
四、捕获多个匹配
有时我们需要从文本中查找多个匹配项。std::regex_search 可以用于查找匹配,但它只会找到第一个匹配项。如果你想捕获所有匹配项,可以使用 std::regex_iterator。
示例 2:提取所有匹配的日期
假设我们有一段文本,其中包含多个日期,我们希望提取所有日期。
#include <iostream>
#include <regex>
#include <string>
#include <iterator>int main() {std::string input = "The event will be held on 2023-02-25, followed by another on 2024-03-01.";// 正则表达式:捕获日期std::regex pattern(R"((\d{4})-(\d{2})-(\d{2}))");std::smatch matches;// 使用 regex_iterator 查找所有匹配auto begin = std::sregex_iterator(input.begin(), input.end(), pattern);auto end = std::sregex_iterator();for (auto it = begin; it != end; ++it) {std::cout << "Found date: " << it->str() << std::endl;}return 0;
}
输出:
Found date: 2023-02-25
Found date: 2024-03-01
使用 std::regex_search 来查找日期的所有匹配
#include <iostream>
#include <regex>
#include <string>int main() {std::string input = "The event will be held on 2023-02-25, followed by another on 2024-03-01.";// 正则表达式:捕获日期std::regex pattern(R"((\d{4})-(\d{2})-(\d{2}))");std::smatch matches;// 使用 cbegin 和 cend 来获取常量迭代器auto begin = input.cbegin();while (std::regex_search(begin, input.cend(), matches, pattern)) {// 输出匹配到的日期std::cout << "Found date: " << matches[0] << std::endl;// 更新搜索起始位置,继续从上一个匹配位置之后开始搜索begin = matches[0].second;}return 0;
}
输出:
Found date: 2023-02-25
Found date: 2024-03-01
五、捕获和替换(regex_replace)
正则表达式不仅可以用于查找和捕获,还可以用于替换匹配的内容。通过 std::regex_replace,你可以将捕获到的内容替换成新的内容。
示例 3:替换日期格式
假设我们希望将日期格式从 YYYY-MM-DD 更改为 DD/MM/YYYY。
#include <iostream>
#include <regex>
#include <string>int main() {std::string input = "The event will be held on 2023-02-25, and another on 2024-03-01.";// 正则表达式:捕获日期std::regex pattern(R"((\d{4})-(\d{2})-(\d{2}))");// 使用 regex_replace 将日期格式替换为 DD/MM/YYYYstd::string output = std::regex_replace(input, pattern, R"($3/$2/$1)");std::cout << "Updated text: " << output << std::endl;return 0;
}
输出:
Updated text: The event will be held on 25/02/2023, and another on 01/03/2024.
六、进阶应用:捕获多个分组
当正则表达式中有多个分组时,你可以通过 matches[n] 访问每个分组的捕获结果。
示例 4:捕获多个分组(例如,提取姓名和年龄)
#include <iostream>
#include <regex>
#include <string>int main() {std::string input = "John Doe, Age: 30; Jane Smith, Age: 25";// 正则表达式:捕获姓名和年龄std::regex pattern(R"((\w+ \w+), Age: (\d+))");std::smatch matches;// 查找匹配auto begin = std::sregex_iterator(input.begin(), input.end(), pattern);auto end = std::sregex_iterator();for (auto it = begin; it != end; ++it) {std::cout << "Name: " << it->str(1) << ", Age: " << it->str(2) << std::endl;}return 0;
}
输出:
Name: John Doe, Age: 30
Name: Jane Smith, Age: 25
七、总结
正则表达式的分组捕获是一个非常强大的工具,它能够让你轻松提取和操作字符串中的特定部分。C++ 中的 <regex> 库提供了灵活的接口,允许你使用正则表达式进行模式匹配、捕获分组、查找多个匹配项以及进行替换操作。通过本文的示例代码,希望你能掌握 C++ 中正则表达式分组捕获的基础应用,并能在实际项目中灵活使用正则表达式来处理文本数据。
相关文章:
C++ 正则表达式分组捕获入门指南
在 C 中,正则表达式(regex)是一种用于匹配字符串模式的强大工具。正则表达式不仅能帮助你查找符合特定模式的字符,还能捕获匹配的子字符串(即分组捕获)。这篇文章将介绍 C 正则表达式中的分组捕获机制&…...
C#中级教程(1)——解锁 C# 编程的调试与错误处理秘籍
一、认识错误:编程路上的 “绊脚石” 在 C# 编程中,错误大致可分为两类:语法错误和语义错误(逻辑错误)。语法错误就像是写作文时的错别字和病句,编译器一眼就能识别出来,比如变量名拼写错误、符…...
Jmeter接口并发测试
Apache JMeter 是一款开源的性能测试工具,广泛用于接口并发测试、负载测试和压力测试。以下是使用 JMeter 进行接口并发测试的详细步骤: 一、准备工作 安装 JMeter 下载地址:Apache JMeter 官网 确保已安装 Java 环境(JMeter 依…...
MySQL-增删改查
一、Create(创建) 📖 语法: INSERT INTO table_name(value_list); 当我们使用表的时候,就可以使用这个语法来向表中插入元素~ 我们这边创建一个用于示范的表(Student)~ create table student( id int, name varchar(20), chinese int, math…...
开源堡垒机 JumpServer 社区版实战教程:发布机的配置与Website资产配置使用
文章目录 开源堡垒机 JumpServer 社区版实战教程:发布机的配置与Website资产配置使用一、功能简述二、应用发布机2.1 版本要求2.2 创建应用发布机2.2.1 通过WinRM的协议进行应用发布机的创建2.2.2 通过OpenSSH的协议进行应用发布机的创建2.2.2.1 下载OpenSSH2.2.2.2…...
【STM32】使用电打火器测试火焰传感器,去掉传感器LED依然亮
项目需求:火焰传感器识别到火焰后,LED灯闪烁,然后熄灭。 现象描述:不需要火焰传感器,当使用电打火器时电路板LED灯也会闪烁。(详情看底部视频) fire.h #ifndef __FIRE_H #define __FIRE_H …...
代码随想录算法训练day64---图论系列8《拓扑排序dijkstra(朴素版)》
代码随想录算法训练 —day64 文章目录 代码随想录算法训练前言一、53. 117. 软件构建—拓扑排序二、47. 参加科学大会---dijkstra(朴素版)总结 前言 今天是算法营的第64天,希望自己能够坚持下来! 今天继续图论part!今…...
机器学习数学基础:32.斯皮尔曼等级相关
斯皮尔曼等级相关教程 一、定义与原理 斯皮尔曼等级相关系数(Spearman’s rank - correlation coefficient),常用 ρ \rho ρ表示,是一种非参数统计量,用于衡量两个变量的等级之间的关联程度。它基于变量的秩次&…...
《论区块链技术及应用》审题技巧 - 系统架构设计师
区块链技术及应用论题写作框架 一、考点概述 本论题“区块链技术及应用”主要考察软件测试工程师对区块链技术的理解及其在软件项目中的实际应用能力。论题涵盖了多个关键方面,首先要求考生对区块链技术有全面的认识,包括但不限于其作为分布式记账技术…...
2024-2025 学年广东省职业院校技能大赛 “信息安全管理与评估”赛项 技能测试试卷(四)
2024-2025 学年广东省职业院校技能大赛 “信息安全管理与评估”赛项 技能测试试卷(四) 第一部分:网络平台搭建与设备安全防护任务书第二部分:网络安全事件响应、数字取证调查、应用程序安全任务书任务 1:应急响应&…...
单片机的串口(USART)
Tx - 数据的发送引脚,Rx - 数据的接受引脚。 串口的数据帧格式 空闲状态高电平,起始位低电平,数据位有8位校验位,9位校验位,停止位是高电平保持一位或者半位,又或者两位的状态。 8位无校验位传输一个字节…...
Modelfile配置说明
参数说明翻译 参数描述值类型示例用法mirostat启用Mirostat采样以控制困惑度。(默认:0,0禁用,1Mirostat,2Mirostat 2.0)intmirostat 0mirostat_eta影响算法对生成文本反馈的响应速度。较低的学习率将导致调…...
pnpm的基本用法
以下是 pnpm 的核心命令和使用指南,涵盖从安装依赖到项目管理的常见操作: 1. 基础命令 (1) 安装依赖 pnpm install # 安装 package.json 中的所有依赖 pnpm install <包名> # 安装指定包(自动添加到 dependencies…...
动态规划(背包问题)--是否逆序使用的问题--二进制拆分的问题
动态规划(背包问题) 题目链接01背包代码 完全背包问题代码 多重背包问题 I代码 什么时候适用逆序多重背包问题 II(超百万级的复杂度)代码 关于二进制拆分 题目链接 01背包 代码 #include <iostream> #include <vector&…...
Vue 中动态实现进度条
在 Vue 中动态实现进度条,基本上有两种常见的方法:直接通过 Vue 数据绑定控制样式,或者利用外部库来实现更复杂的功能。我们会深入探讨这两种方式,并且详细说明每种方法的实现步骤、优缺点以及使用场景。 1. 使用 Vue 数据绑定来…...
如何基于PyTorch做二次开发
基于PyTorch进行二次开发以实现可视化工程,可以从以下几个方面入手:模型结构可视化、训练过程监控、特征可视化等。以下是一些推荐的GitHub项目,这些项目可以帮助你快速搭建一个可视化的工程环境: ### 1. **PyTorch CNN Visualiz…...
Mac 版 本地部署deepseek ➕ RAGflow 知识库搭建流程分享(附问题解决方法)
安装: 1、首先按照此视频的流程一步一步进行安装:(macos版)ragflowdeepseek 私域知识库搭建流程分享_哔哩哔哩_bilibili 2、RAGflow 官网文档指南:https://ragflow.io 3、RAGflow 下载地址:https://github.com/infi…...
算法——后缀平衡树
先回想一下之前讨论的内容。之前我们详细讨论了后缀树,包括它的构建、应用以及相关算法。用户可能是在了解后缀树之后,想要进一步探索相关的数据结构,或者是想比较后缀树和后缀平衡树的异同。 后缀平衡树并不是一个常见的数据结构名称&#…...
姿态矩阵/旋转矩阵/反对称阵
物理意义,端点矢量角速率叉乘本身向量; 负号是动系b看固定系i是相反的; 一个固定 在惯性导航解算中,旋转矢量的叉乘用于描述姿态矩阵的微分方程。你提到的公式中, ω i b b \boldsymbol{\omega}_{ib}^b \times ωibb…...
【大语言模型】【整合版】DeepSeek 模型提示词学习笔记(散装的可以看我之前的学习笔记,这里只是归纳与总结了一下思路,内容和之前发的差不多)
以下是个人笔记的正文内容: 原文在FlowUs知识库上,如下截图。里面内容和这里一样,知识排版好看一点 一、什么是 DeepSeek 1. DeepSeek 简介 DeepSeek 是一家专注于通用人工智能(AGI)的中国科技公司,主攻大模型研发与…...
ollama无法通过IP:11434访问
目录 1.介绍 2.直接在ollama的当前命令窗口中修改(法1) 3.更改ollama配置文件(法2) 3.1更新配置 3.2重启服务 1.介绍 ollama下载后默认情况下都是直接在本地的11434端口中运行,绑定到127.0.0.1(localhost)&#x…...
⭐算法OJ⭐位操作用法总结+实战指南(C++实现)
位操作在OJ 题目中是一种非常高效的工具,常用于优化时间复杂度和空间复杂度。本文是位操作在 OJ 题目中的主要用法总结,并以 C 实现为例。 相关题目:《C⭐算法OJ⭐Single Number 系列(位操作)》 文章目录 1. 基本位操…...
2.1 用大模型构建新人答疑机器人-大模型ACP模拟题-真题
真题 真题:如何初始化OpenAI客户端 client OpenAI( api_keyos.getenv("DASHSCOPE_API_KEY"), base_url"https://dashscope.aliyuncs.com/compatible-mode/v1", ) AI生成模拟题 一、单选题 (每题5分,共6题ÿ…...
单片机裸机编程-时机管理
对于 RTOS 实时操作系统,我们是通过 TASK(任务)进行底层操作的,这与裸机编程中的函数(fun)类似。不同的任务或函数实现不同的功能,在RTOS中,单片机有信号量、队列等不同任务之间的通…...
Bugku CTF CRYPTO
Bugku CTF CRYPTO 文章目录 Bugku CTF CRYPTO聪明的小羊ok[-<>]散乱的密文.!? 聪明的小羊 描 述: 一只小羊翻过了2个栅栏 fa{fe13f590lg6d46d0d0} 分 析:栅栏密码,分2栏,一个栏里有11个 ①手动解密 f a { f e 1 3 f 5 9 0 l g 6 d 4 …...
【洛谷】【ARC100E】Or Plus Max(高维前缀和)
传送门:Or Plus Max 高维前缀和 题目描述 長さ 2N の整数列 A0, A1, ..., A2N−1 があります。(添字が 0 から始まることに注意) 1 ≤ K ≤ 2N−1 を満たすすべての整数 K について、次の問題を解いてください。 i,j を整数と…...
宿主机的 root 是否等于 Docker 容器的 root?
在 Docker 容器化技术中,宿主机的 root 和 容器的 root 并不完全相同,尽管它们都称作 “root 用户”。这里需要明确的是,Docker 容器与宿主机之间存在隔离机制,容器内的 root 用户和宿主机的 root 用户有一些关键的区别。 1. 宿主…...
SmolLM2:多阶段训练策略优化和高质量数据集,小型语言模型同样可以实现卓越的性能表现
SmolLM2 采用创新的四阶段训练策略,在仅使用 1.7B 参数的情况下,成功挑战了大型语言模型的性能边界: 在 MMLU-Pro 等测试中超越 Qwen2.5-1.5B 近 6 个百分点数学推理能力(GSM8K、MATH)优于 Llama3.2-1B在代码生成和文…...
云原生降本之路:技术创新与应用解析
随着云计算的快速发展,云原生技术已成为企业降低成本、提高效率的重要手段。本文基于腾讯云容器技术专家孟凡杰的PPT内容,深入探讨了云原生技术在降低企业成本方面的应用,包括资源利用现状、成本优化思路、Kubernetes中的资源分配、横向与纵向…...
《Effective Objective-C》阅读笔记(中)
目录 接口与API设计 用前缀避免命名空间冲突 提供“全能初始化方法” 实现description方法 尽量使用不可变对象 使用清晰而协调的命名方式 方法命名 编辑类与协议命名 为私有方法名加前缀 理解OC错误模型 理解NSCopying协议 协议与分类 通过委托与数据源协议进行…...
