Python正则表达式提取车牌号
在Python中使用正则表达式(Regular Expressions)来提取车牌号是一个常见的任务,尤其是在处理车辆信息或进行图像识别后的文本处理时。中国的车牌号格式多种多样,但通常包含省份简称、英文字母和数字。以下是一个使用Python正则表达式来提取常见中国车牌号(包括新能源车牌)的示例代码。
1.简单代码示例
首先,我们需要导入re模块,这是Python中用于处理正则表达式的标准库。然后,我们可以编写一个函数来匹配并提取车牌号。
import re def extract_license_plates(text): """ 从给定的文本中提取车牌号。 支持普通车牌(如京A12345)和新能源车牌(如京AD12345F)。 :param text: 包含车牌号信息的字符串 :return: 提取到的车牌号列表 """ # 定义车牌号的正则表达式 # 普通车牌:[省份简称][A-Z][A-Z0-9]{4}[A-Z0-9挂学警港澳] # 新能源车牌:[省份简称][A-DF][A-Z0-9]{5}[DF][A-Z0-9挂学警港澳] plate_pattern = re.compile(r'[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领A-Z][A-Z](?:(?:[A-Z0-9]{5}[DF])|(?:[DF][A-Z0-9][A-Z0-9]{4}))[A-Z0-9挂学警港澳]') # 查找所有匹配的车牌号 plates = plate_pattern.findall(text) return plates # 示例文本
text = "今天在路上看到了一辆车牌号为京A12345的车和另一辆新能源车牌京AD12345F的车。" # 调用函数并打印结果
plates = extract_license_plates(text)
print("找到的车牌号:", plates)
注意
(1)正则表达式说明:
-
普通车牌号以省份简称开始,后面跟着一个大写字母,然后是5位数字或字母(最后一位可以是挂、学、警、港、澳等特殊字符)。
-
新能源车牌在省份简称后有一个特定的字母(A、D、F),然后是5位数字或字母,最后以D或F开头,再跟一个字符(同样可以是挂、学、警、港、澳等特殊字符)。
-
本示例中简化了省份简称的匹配,直接列出了所有可能的省份简称(如“京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领”),实际应用中可能需要更新或动态生成这部分内容。
(2)性能考虑:
-
如果需要处理大量的文本数据,考虑正则表达式的优化和性能影响。
-
正则表达式编写时,尽量保持简洁和精确,避免不必要的回溯和复杂匹配。
(3)实际应用:
-
在实际应用中,车牌号的格式可能会因地区、时间等因素有所不同,因此正则表达式需要根据实际情况进行调整。
-
如果车牌号信息来自图像识别结果,可能需要先对识别结果进行预处理(如去除噪点、归一化等),以提高正则表达式的匹配准确率。
2.进阶代码示例
以下是一个更详细的代码示例,它包含了处理多种情况的车牌号提取功能。这个示例中,我将对正则表达式进行微调以更好地匹配普通车牌和新能源车牌,并且会添加一些注释来解释代码的各个部分。此外,我还会在示例文本中增加一些复杂的情况来测试我们的函数。
import re def extract_license_plates(text): """ 从给定的文本中提取车牌号。 支持普通车牌(如京A12345)和新能源车牌(如京AD12345F)。 :param text: 包含车牌号信息的字符串 :return: 提取到的车牌号列表 """ # 定义车牌号的正则表达式 # 普通车牌:[省份简称][A-Z]([A-Z0-9]{5}[A-Z0-9挂学警港澳]) # 新能源车牌:[省份简称][A-DF]([A-Z0-9]{4}[DF][A-Z0-9挂学警港澳]) # 注意:这里简化了新能源车牌的正则,因为新能源车牌第二位可能不是字母D或F,但通常后面会有DF组合 # 为了更准确地匹配,我们可以将两个模式分开 normal_plate_pattern = r'[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领][A-Z][A-Z0-9]{5}[A-Z0-9挂学警港澳]' new_energy_plate_pattern = r'[京津沪渝冀豫云辽黑湘皖鲁新苏浙赣鄂桂甘晋蒙陕吉闽贵粤青藏川宁琼使领][A-DF][A-Z0-9]{4}[DF][A-Z0-9挂学警港澳]' # 合并为一个正则表达式,使用 | 表示“或” plate_pattern = re.compile(f'({normal_plate_pattern})|({new_energy_plate_pattern})') # 查找所有匹配的车牌号 plates = plate_pattern.findall(text) # 由于findall返回的是一个元组的列表,其中每个元组包含一个或多个匹配项(取决于正则表达式中有多少捕获组) # 在这个例子中,我们有两个捕获组,但只关心其中一个有值的情况(即匹配到的是普通车牌还是新能源车牌) # 因此,我们需要从每个元组中提取出实际的车牌号 clean_plates = [match[0] if match[0] else match[1] for match in plates] return clean_plates # 示例文本,包含多种车牌号
text = "今天在路上看到了车牌号为京A12345的燃油车,还有新能源车牌京AD12345F和一辆苏B23456警的警车。" # 调用函数并打印结果
plates = extract_license_plates(text)
print("找到的车牌号:", plates)
注意:
(1)我将新能源车牌的正则表达式进行了调整,以更准确地匹配新能源车牌的常见格式。但请注意,实际中的新能源车牌格式可能更加多样,因此这个正则表达式可能需要进一步调整以适应所有情况。
(2)在处理findall返回的结果时,我使用了列表推导式来遍历所有匹配项,并从每个元组中提取出实际的车牌号。这是因为当正则表达式中有多个捕获组时,findall会返回一个包含元组的列表,每个元组包含与每个捕获组相匹配的文本。在这个例子中,每个元组要么第一个元素有值(匹配到普通车牌),要么第二个元素有值(匹配到新能源车牌),因此我们使用条件表达式来从中提取出车牌号。
(3)示例文本中包含了多种车牌号,包括普通车牌、新能源车牌和特殊车辆(警车)的车牌,以测试函数的健壮性。
相关文章:
Python正则表达式提取车牌号
在Python中使用正则表达式(Regular Expressions)来提取车牌号是一个常见的任务,尤其是在处理车辆信息或进行图像识别后的文本处理时。中国的车牌号格式多种多样,但通常包含省份简称、英文字母和数字。以下是一个使用Python正则表达…...
视觉引导机械臂学习记录
首先是几个位置,拍照位、示教位、目标位置。 流程主要是 1.首先选取一个拍照位,相机扫描点云,通过点云质量进行选取。并且制作点云模板,进行配准,如果配准分数高则模板选取正确。 2.用相机拍灰度图像,并…...
插屏广告在游戏APP中广告变现的独特优势
插屏广告是目前全球移动应用变现的主要广告形式之一,其优势在于可以快速收回成本,又能适应于多数缺乏激励场景的应用。 插屏广告通常在app使用过程中的自然过渡点,比如暂停场景切换的时候弹出,以图片、动图、视频等为表现形式的半…...
Python数据分析:数据可视化(Matplotlib、Seaborn)
数据可视化是数据分析中不可或缺的一部分,通过将数据以图形的方式展示出来,可以更直观地理解数据的分布和趋势。在Python中,Matplotlib和Seaborn是两个非常流行和强大的数据可视化库。本文将详细介绍这两个库的使用方法,并附上一个…...
Java CompletableFuture:你真的了解它吗?
文章目录 1 什么是 CompletableFuture?2 如何正确使用 CompletableFuture 对象?3 如何结合回调函数处理异步任务结果?4 如何组合并处理多个 CompletableFuture? 1 什么是 CompletableFuture? CompletableFuture 是 Ja…...
5个免费在线 AI 绘画网站推荐,附100+提示词!
在数字化时代,艺术创作与人工智能的结合已带来前所未有的创新体验。AI 绘画技术,基于先进的人工智能算法,为艺术创作提供了全新的视角和工具。当前,多个免费在线AI绘画平台应运而生,为创作者们提供了丰富的灵感和创作机…...
C++基础语法:while的使用
前言 "打牢基础,万事不愁" .C的基础语法的学习."学以致用,边学边用",编程是实践性很强的技术,在运用中理解,总结. 引入 while的使用是编写代码的基础内容.笔者的记忆力已不如以前,最近遇到了还花了不少功夫,可见是掌握地不够牢固.所以对while的思路和内容…...
鹏哥C语言自定义笔记重点(29-)
29.函数指针数组 30.void指针是不能直接解引用,也不能-整数。 void*是无具体类型的指针,可以接受任何类型的地址。 31.qsort:使用快速排序的思想实现一个排序函数(升序) 32. 33.地址的字节是4/8 34.char arr[]{a,b} sizeof(arr[0]1)答案是4࿰…...
代码随想录算法训练营第六十天 | dijkstra(堆优化版)、Bellman_ford 算法精讲
一、dijkstra(堆优化版) 题目连接:47. 参加科学大会(第六期模拟笔试) (kamacoder.com) 文章讲解:代码随想录 (programmercarl.com)——dijkstra(堆优化版) 二、Bellman_ford 算法精讲…...
boost::asio 库版本,C/C++代码编译兼容性
1、boost::asio::spawn 开启有栈(stackful)协同程序,版本改进及限制 > boost_1_80 版本应采用以下方式。 auto f [self, this](const boost::asio::yield_context& y) noexcept {bool success_ do_handshake(y);if (!success_) {clo…...
前端开发的项目导入方法与应用
前端项目启动问题归集: 由于前端的项目对于npm的版本有要求,需要将其升级到20,所以必要的时候通过nvm,或者直接下载最新的安装包进行npm覆盖安装。在项目目录中应用npm i安装node_modules,如果没有正常安装的话&#…...
C++:模拟实现string
前言: 为了更好的理解string底层的原理,我们将模拟实现string类中常用的函数接口。为了与std里的string进行区分,所以用命名空间来封装一个自己的strin类。 string.h #pragma once #define _CRT_SECURE_NO_WARNINGS 1#include<iostream&…...
浅谈Kafka(一)
浅谈Kafka(一) 文章目录 浅谈Kafka(一)Kafa的设计是什么样的数据传输的事务定义消息队列的应用场景Kafka怎么样判断节点是否存活Kafka的消息是采用pull模式还是push模式Kafka在磁盘上的消息格式Kafka高效文件存储设计特点Kafka与传…...
Redis7基础篇(八)
redis集群 是什么 能干吗 集群算法-分片-槽位slot redis集群的槽位slot redis集群的分片 分片和槽位的优势 槽位映射的解决方案 上面的三个方案分别对应了小厂 中厂 大厂 哈希槽取余分区 缺点 一致性哈希算法分区 小总结 哈希槽分区 经典面试题 这里说的redis是ap而不是cp的 …...
Tauri简介
在Tauri应用中,Rust和前端(通常是基于Web技术如React、Vue或Angular)之间的交互是一个核心特性,它允许开发者利用Rust的强大功能和性能,同时保持前端开发的灵活性和丰富的生态系统。这种交互主要通过Tauri提供的API桥接…...
JavaWeb——MVC架构模式
一、概述: MVC(Model View Controller)是软件工程中的一种 软件架构模式 ,它把软件系统分为模型、视图和控制器三个基本部分。用一种业务逻辑、数据、界面显示分离的方法组织代码,将业务逻辑聚集到一个部件里面,在改进和个性化定制界面及用户…...
Excel求和方法之
一 SUM(),选择要相加的数,回车即可 二 上面的方法还不够快。用下面这个 就成功了 三 还有一种一样快的 选中之后,按下Alt键和键(即Alt)...
Windows Server 域控制服务器安装及相关使用
目录 1.将客户机加入域 2.安装域控制器 3.新建域用户 4.设置用户登录时间,账户过期时间 5.软件分发 编辑 6.换壁纸 7.OU与GPO的概念 域为集中控制,拿下域控是拿下目标的关键 以Windows Server 2022为例 1.将客户机加入域 前提:客…...
linux基础命令(超级详细)
Linux 系统提供了丰富的命令行工具,用于各种文件操作、系统管理和网络配置等任务。以下是一些常用的 Linux 基础命令: 一、 文件和目录操作 1. ls: 列出目录内容 ls 列出当前目录的文件和目录 ls -l 以长格式列出文件和目录,包…...
大模型笔记之-XTuner微调个人小助手认知
前言 使用XTuner 微调个人小助手认知 一、下载模型 #安装魔搭依赖包 pip install modelscope新建download.py内容如下 其中Shanghai_AI_Laboratory/internlm2-chat-1_8b是魔搭对应的模型ID cache_dir/home/aistudio/data/model’为指定下载到本地的目录 from modelscope im…...
深度学习在微纳光子学中的应用
深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向: 逆向设计 通过神经网络快速预测微纳结构的光学响应,替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…...
内存分配函数malloc kmalloc vmalloc
内存分配函数malloc kmalloc vmalloc malloc实现步骤: 1)请求大小调整:首先,malloc 需要调整用户请求的大小,以适应内部数据结构(例如,可能需要存储额外的元数据)。通常,这包括对齐调整,确保分配的内存地址满足特定硬件要求(如对齐到8字节或16字节边界)。 2)空闲…...
mongodb源码分析session执行handleRequest命令find过程
mongo/transport/service_state_machine.cpp已经分析startSession创建ASIOSession过程,并且验证connection是否超过限制ASIOSession和connection是循环接受客户端命令,把数据流转换成Message,状态转变流程是:State::Created 》 St…...
UE5 学习系列(三)创建和移动物体
这篇博客是该系列的第三篇,是在之前两篇博客的基础上展开,主要介绍如何在操作界面中创建和拖动物体,这篇博客跟随的视频链接如下: B 站视频:s03-创建和移动物体 如果你不打算开之前的博客并且对UE5 比较熟的话按照以…...
条件运算符
C中的三目运算符(也称条件运算符,英文:ternary operator)是一种简洁的条件选择语句,语法如下: 条件表达式 ? 表达式1 : 表达式2• 如果“条件表达式”为true,则整个表达式的结果为“表达式1”…...
STM32标准库-DMA直接存储器存取
文章目录 一、DMA1.1简介1.2存储器映像1.3DMA框图1.4DMA基本结构1.5DMA请求1.6数据宽度与对齐1.7数据转运DMA1.8ADC扫描模式DMA 二、数据转运DMA2.1接线图2.2代码2.3相关API 一、DMA 1.1简介 DMA(Direct Memory Access)直接存储器存取 DMA可以提供外设…...
c++ 面试题(1)-----深度优先搜索(DFS)实现
操作系统:ubuntu22.04 IDE:Visual Studio Code 编程语言:C11 题目描述 地上有一个 m 行 n 列的方格,从坐标 [0,0] 起始。一个机器人可以从某一格移动到上下左右四个格子,但不能进入行坐标和列坐标的数位之和大于 k 的格子。 例…...
家政维修平台实战20:权限设计
目录 1 获取工人信息2 搭建工人入口3 权限判断总结 目前我们已经搭建好了基础的用户体系,主要是分成几个表,用户表我们是记录用户的基础信息,包括手机、昵称、头像。而工人和员工各有各的表。那么就有一个问题,不同的角色…...
鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个生活电费的缴纳和查询小程序
一、项目初始化与配置 1. 创建项目 ohpm init harmony/utility-payment-app 2. 配置权限 // module.json5 {"requestPermissions": [{"name": "ohos.permission.INTERNET"},{"name": "ohos.permission.GET_NETWORK_INFO"…...
R语言速释制剂QBD解决方案之三
本文是《Quality by Design for ANDAs: An Example for Immediate-Release Dosage Forms》第一个处方的R语言解决方案。 第一个处方研究评估原料药粒径分布、MCC/Lactose比例、崩解剂用量对制剂CQAs的影响。 第二处方研究用于理解颗粒外加硬脂酸镁和滑石粉对片剂质量和可生产…...
