当前位置：首页 > news >正文

AI项目十三：PaddleOCR训练自定义数据集

news 2026/2/10 7:13:56

若该文为原创文章，转载请注明原文出处。

续上一篇，PaddleOCR环境搭建好了，并测试通过，接下来训练自己的检测模型和识别模型。

paddleocr检测模型训练

1、准备数据集

在PaddleOCR目录下新建文件夹：train_data, 这个文件夹用于存放数据集的。

使用的是恩培提供的车牌识别数据集，下载car_plate_images.zip后，解压到train_data目录下。

2、配置文件

在PaddleOCR主目录下：configs/det/ch_ppocr_v2.0/下，

复制ch_det_mv3_db_v2.0.yml为ch_det_mv3_db_v2.0.yml_car_plate.yml

打开ch_det_mv3_db_v2.0.yml_car_plate.yml配置文件,修改以下4个内容:

1.训练后模型存储目录；

2.是否训练可视化；

3.训练数据集图片和标注位置；

4.测试数据集图片和标注位置；

其他参数如pretrained_model等可以在训练时在命令行中指定.其它的看官方文档

ch_det_mv3_db_v2.0.yml_car_plate.yml文件内修改

我的电脑没有gpu，所以use_gpu需要修改成false

配置文件完后，创建保存模型目录output/ch_ppocr_mobile_v2.0_det：

3、使用官方的权重文件进行预测

打开PaddleOCR/doc/doc_ch/models_list.md at release/2.6 · PaddlePaddle/PaddleOCR · GitHub

下载权重文件

下载后，解压，把权重文件放到PaddleOCR\pretrain_models\目录下，pretrain_models目录自己创建。

接下来先预测一下：

预测命令：

python tools/eval.py -c "./configs/det/ch_ppocr_v2.0/ch_det_mv3_db_v2.0.yml_car_plate.yml" -o Global.checkpoints="./pretrain_models/ch_ppocr_server_v2.0_det_train/best_accuracy"

4、训练

训练命令：

python tools/train.py -c "./configs/det/ch_ppocr_v2.0/ch_det_mv3_db_v2.0.yml_car_plate.yml" -o Global.pretrained_model="./pretrain_models/ch_ppocr_server_v2.0_det_train/best_accuracy"

参数解释：

-c 是配置文件的路径

-o 是权重文件的路径

预测 -o Global.checkpoints=

训练 -o Global.pretrained_model=

注意这两个不一样。

断点续训： -o Global.checkpoints：保存的文件路径

python tools/train.py -c "./configs/det/ch_ppocr_v2.0/ch_det_mv3_db_v2.0.yml_car_plate.yml" -o Global.pretrained_model="./mode/det/ch_ppocr_server_v2.0_det_train/best_accuracy" -o Global.checkpoints="./output/ch_db_mv3/latest"

5、測試

使用训练模型–测试1张图 -o Global.infer_img：文件位置

python tools/infer_det.py -c "./configs/det/ch_ppocr_v2.0/ch_det_mv3_db_v2.0.yml_car_plate.yml"  -o Global.infer_img="./train_data/car_plate_images/images_det/test/test_5.jpg" Global.pretrained_model="./output/ch_ppocr_mobile_v2.0_det/latest"

使用训练模型–测试文件夹内所有图片 新建文件夹imgs 放测试的图片 -o Global.infer_img：文件夹位置

python tools/infer_det.py -c "./configs/det/ch_ppocr_v2.0/ch_det_mv3_db_v2.0.yml_car_plate.yml"  -o Global.infer_img="./imgs/" Global.pretrained_model="./output/ch_db_mv3/latest"

训练模型保存为用于部署的推理模型 保存路径：output文件夹内

python tools/export_model.py -c "./configs/det/ch_ppocr_v2.0/ch_det_mv3_db_v2.0.yml_car_plate.yml" -o Global.pretrained_model="./output/ch_db_mv3/latest" Global.save_inference_dir="./output/"

使用推理模型–预测命令： #det_algorithm 检测使用的算法 #det_model_dir 检测模型位置 #image_dir 测试图片路径 #use_gpu 是否使用GPU

python tools/infer/predict_det.py --det_algorithm="DB" --det_model_dir="./output/" --image_dir="./car_plate_images/images_det/test/" --use_gpu=True

如有侵权，或需要完整代码，请及时联系博主。

AI项目十三：PaddleOCR训练自定义数据集

若该文为原创文章，转载请注明原文出处。续上一篇，PaddleOCR环境搭建好了，并测试通过，接下来训练自己的检测模型和识别模型。 paddleocr检测模型训练 1、准备数据集在PaddleOCR目录下新建文件夹：train_data, 这个…...

编程日记 2023/9/30 23:00:31

你熟悉Docker吗？

你熟悉Docker吗？ 文章目录你熟悉Docker吗？快速入门Docker安装1.卸载旧版2.配置Docker的yum库3.安装Docker4.启动和校验5.配置镜像加速5.1.注册阿里云账号5.2.开通镜像服务5.3.配置镜像加速部署MySQL镜像和容器命令解读 Docker基础常用命令数据卷数据卷…...

编程日记 2023/9/30 22:59:30

Nodejs错误处理详细指南

Nodejs错误处理详细指南学习 Node.js 中的高级错误处理技术，以增强应用程序的可靠性和稳定性。在 Node.js 中，我们可以使用各种技术和方法来处理错误，可以查看这篇文章。错误处理是任何 Node.js 应用程序的一个重要方面。正确管理错误可以…...

编程日记 2023/9/30 22:53:24

软考系统架构设计师系列知识点之软件架构风格

这个十一注定是一个不能放松、保持“紧”的十一。由于报名了全国计算机技术与软件专业技术资格（水平）考试，11月4号就要考试，因此8天长假绝不能荒废，必须要好好利用起来。现在将各个核心知识点一一进行提炼并做记录。所…...

编程日记 2023/9/30 22:51:23

一键智能视频语音转文本——基于PaddlePaddle语音识别与Python轻松提取视频语音并生成文案

前言如今进行入自媒体行业的人越来越多，短视频也逐渐成为了主流，但好多时候是想如何把视频里面的语音转成文字，比如，录制会议视频后，做会议纪要；比如，网课教程视频，想要做笔记&…...

编程日记 2023/9/30 22:49:21

序抽象的图纸叫类，包含具体数据的叫对象。类的序列化和反序列化 using System.Collections; using System.Collections.Generic; using UnityEngine;using System; using System.IO; using System.Runtime.Serialization.Formatters.Binary; [Serializabl…...

编程日记 2023/9/30 22:47:18

java开发岗位面试

java开发岗位面试技术栈：springboot框架＋redis 个人笔试/技术面问题整理 1、SpringBoot有什么组件？ 举例说几个： ①auto-configuration组件：核心特征。其约定大于配置思想，赋予了SpringBoot开箱即用的强…...

编程日记 2023/9/30 22:44:16

坠落防护挂点装置

声明本文是学习GB 30862-2014 坠落防护挂点装置. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 1 范围本标准规定了高处坠落防护挂点装置的技术要求、检验方法、检验规则及标识。本标准适用于防护高处坠落的挂点装置。本标准不适用于体育及消…...

编程日记 2023/9/30 22:42:13

关于自定义的RabbitMQ的RabbitMessageContainer注解-实现原理

概述 RabbitMessageContainer注解的主要作用就是替换掉Configuration配置类中的各种Bean配置； 采用注解的方式可以让我们固化配置，降低代码编写复杂度、减少配置错误情况的发生，提升编码调试的效率、提高业务的可用性。为什么说“降低…...

编程日记 2023/9/30 22:36:06

uniapp快速入门系列（1）- 概述与基础知识

章节三：抖音小程序页面开发第1章：概述与基础知识1.1 uniapp简介1.1.1 什么是uniapp？1.1.2 为什么选择uniapp？1.1.3 uniapp与微信小程序的关系 1.2 HBuilderX介绍与安装1.2.1 什么是HBuilderX？1.2.2 HBuilderX的安装1.…...

编程日记 2023/9/30 22:35:05

国密国际SSL双证书解决方案，满足企事业单位国产国密SSL证书要求

近年来，为了摆脱对国外技术和产品的依赖，建设安全的网络环境，以及加强我国对网络信息的安全可控能力，我国推出了国密算法。同时，为保护网络通信信息安全，更高级别的安全加密数字证书—国密SSL证书应运而生。…...

编程日记 2023/9/30 22:33:01

LabVIEW开发虚拟与现实融合的数字电子技术渐进式实验系统

LabVIEW开发虚拟与现实融合的数字电子技术渐进式实验系统数字电子技术是所有电气专业的重要学科基础，具有很强的理论性和实践性。其实验是提高学生分析、设计和调试数字电路能力，培养学生解决实际问题的工程实践能力，激发学生创新意识&…...

编程日记 2023/9/30 22:29:58

机器学习之单层神经网络的训练：增量规则（Delta Rule）

文章目录权重的调整单层神经网络使用delta规则的训练过程神经网络以权值的形式存储信息,根据给定的信息来修改权值的系统方法称为学习规则。由于训练是神经网络系统地存储信息的唯一途径，因此学习规则是神经网络研究中的一个重要组成部分权重的调整 &#xff08…...

编程日记 2023/9/30 22:28:57

C# Task任务详解

文章目录前言Task返回值无参返回有参返回 async和await返回值await搭配使用Main async改造 Task进阶Task线程取消测试用例超时设置线程暂停和继续测试用例多任务等最快多任务全等待结论前言 Task是对于Thread的封装，是极其优化的设计，更加方便了我…...

编程日记 2023/9/30 22:27:56

百度网盘的扩容

百度网盘的扩容怎么扩百度网盘的扩容通常需要购买额外的存储空间。以下是扩容百度网盘存储空间的一般步骤： 登录百度网盘：首先，在您的计算机或移动设备上打开百度网盘，并使用您的百度账号登录。选择扩容选项：一旦登…...

编程日记 2023/9/30 22:26:54

Android 悬浮窗

本文参考文章地址：https://juejin.cn/post/7009180088310693919 一、申请权限 <uses-permission android:name"android.permission.SYSTEM_ALERT_WINDOW" />二、创建悬浮窗service <serviceandroid:name".FloatingWindowService"an…...

编程日记 2023/9/30 22:24:52

3.物联网射频识别，（高频）RFID应用ISO14443-2协议

一。ISO14443-2协议简介 1.ISO14443协议组成及部分缩略语 （1）14443协议组成（下面的协议简介会详细介绍） 14443-1 物理特性 14443-2 射频功率和信号接口 14443-3 初始化和防冲突 （分为Type A、Type B两种接口&…...

编程日记 2023/9/30 22:23:51

数据分析笔记1

数据分析概述：数据获取--探索分析与可视化--预处理--分析建模--模型评估数据分析含义：利用统计与概率的分析方法提取有用的信息，最后进行总结与概括一、数据获取实用网站：kaggle 阿里云天池数据仓库：将所有业务数据…...

编程日记 2023/9/30 22:22:50

paramiko 3

import paramiko import concurrent.futuresdef execute_remote_command(hostname, username, password, command):try:# 创建SSH客户端client paramiko.SSHClient()client.set_missing_host_key_policy(paramiko.AutoAddPolicy())# 使用密码认证连接远程主机client.connect(h…...

编程日记 2023/9/30 22:18:43

基于Dlib训练自已的人脸数据集提高人脸识别的准确率

前言由于图像的质量、光线、角度等因素影响。这时如果使用官方提供的模型做人脸识别，就会导至识别率不是很理想。人脸识别的准确率与图像的清晰度和质量有关。如果图像模糊、光线不足或者有其他干扰因素，Dlib 可能无法正确地识别人脸。为了确保图像质量…...

编程日记 2023/9/30 22:17:41

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录第一章概述第二章弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制第三章主要定义 …...

编程新知 2026/1/22 6:07:24

centos 7 部署awstats 网站访问检测

一、基础环境准备（两种安装方式都要做） bash # 安装必要依赖 yum install -y httpd perl mod_perl perl-Time-HiRes perl-DateTime systemctl enable httpd # 设置 Apache 开机自启 systemctl start httpd # 启动 Apache二、安装 AWStats&#xff0…...

编程新知 2026/1/23 8:33:56

Caliper 配置文件解析：config.yaml

Caliper 是一个区块链性能基准测试工具，用于评估不同区块链平台的性能。下面我将详细解释你提供的 fisco-bcos.json 文件结构，并说明它与 config.yaml 文件的关系。 fisco-bcos.json 文件解析这个文件是针对 FISCO-BCOS 区块链网络的 Caliper 配置文件，主要包含以下几个部…...

编程新知 2025/8/13 13:40:18

如何在最短时间内提升打ctf（web)的水平？

刚刚刷完2遍 bugku 的 web 题，前来答题。每个人对刷题理解是不同，有的人是看了writeup就等于刷了，有的人是收藏了writeup就等于刷了，有的人是跟着writeup做了一遍就等于刷了，还有的人是独立思考做了一遍就等于刷了。…...

编程新知 2026/1/28 5:55:15

Spring是如何解决Bean的循环依赖：三级缓存机制

1、什么是 Bean 的循环依赖在 Spring框架中，Bean 的循环依赖是指多个 Bean 之间‌互相持有对方引用‌，形成闭环依赖关系的现象。多个 Bean 的依赖关系构成环形链路，例如：双向依赖：Bean A 依赖 Bean B，同时 Bean B 也依赖 Bean A（A↔B）。链条循环： Bean A → Bean…...

编程新知 2025/7/25 1:21:53

推荐 github 项目:GeminiImageApp(图片生成方向，可以做一定的素材)

推荐 github 项目:GeminiImageApp(图片生成方向，可以做一定的素材) 这个项目能干嘛? 使用 gemini 2.0 的 api 和 google 其他的 api 来做衍生处理简化和优化了文生图和图生图的行为(我的最主要) 并且有一些目标检测和切割(我用不到) 视频和 imagefx 因为没 a…...

编程新知 2026/1/25 10:41:07

使用LangGraph和LangSmith构建多智能体人工智能系统

现在，通过组合几个较小的子智能体来创建一个强大的人工智能智能体正成为一种趋势。但这也带来了一些挑战，比如减少幻觉、管理对话流程、在测试期间留意智能体的工作方式、允许人工介入以及评估其性能。你需要进行大量的反复试验。在这篇博客〔原作者&a…...

编程新知 2026/1/26 13:48:59

第7篇：中间件全链路监控与 SQL 性能分析实践

7.1 章节导读在构建数据库中间件的过程中，可观测性和性能分析是保障系统稳定性与可维护性的核心能力。特别是在复杂分布式场景中，必须做到： 🔍 追踪每一条 SQL 的生命周期（从入口到数据库执行）&#…...

编程新知 2025/12/11 0:27:15

深度学习之模型压缩三驾马车：模型剪枝、模型量化、知识蒸馏

一、引言在深度学习中，我们训练出的神经网络往往非常庞大（比如像 ResNet、YOLOv8、Vision Transformer），虽然精度很高，但“太重”了，运行起来很慢，占用内存大，不适合部署到手机、摄…...

编程新知 2025/9/24 3:56:34

VisualXML全新升级 | 新增数据库编辑功能

VisualXML是一个功能强大的网络总线设计工具，专注于简化汽车电子系统中复杂的网络数据设计操作。它支持多种主流总线网络格式的数据编辑（如DBC、LDF、ARXML、HEX等），并能够基于Excel表格的方式生成和转换多种数据库文件。由此&…...

编程新知 2026/2/6 5:51:15

AI项目十三：PaddleOCR训练自定义数据集

paddleocr检测模型训练

1、准备数据集

2、配置文件

3、使用官方的权重文件进行预测

4、训练

5、測試

相关文章：

AI项目十三：PaddleOCR训练自定义数据集

你熟悉Docker吗？

Nodejs错误处理详细指南

软考系统架构设计师系列知识点之软件架构风格

一键智能视频语音转文本——基于PaddlePaddle语音识别与Python轻松提取视频语音并生成文案

[unity]对象的序列化

java开发岗位面试

坠落防护挂点装置

关于自定义的RabbitMQ的RabbitMessageContainer注解-实现原理

uniapp快速入门系列（1）- 概述与基础知识

国密国际SSL双证书解决方案，满足企事业单位国产国密SSL证书要求

LabVIEW开发虚拟与现实融合的数字电子技术渐进式实验系统

机器学习之单层神经网络的训练：增量规则（Delta Rule）

C# Task任务详解

百度网盘的扩容

Android 悬浮窗

3.物联网射频识别，（高频）RFID应用ISO14443-2协议

数据分析笔记1

paramiko 3

基于Dlib训练自已的人脸数据集提高人脸识别的准确率

阿里云ACP云计算备考笔记 (5)——弹性伸缩

centos 7 部署awstats 网站访问检测

Caliper 配置文件解析：config.yaml

如何在最短时间内提升打ctf（web)的水平？

Spring是如何解决Bean的循环依赖：三级缓存机制

推荐 github 项目:GeminiImageApp(图片生成方向，可以做一定的素材)

使用LangGraph和LangSmith构建多智能体人工智能系统

第7篇：中间件全链路监控与 SQL 性能分析实践

深度学习之模型压缩三驾马车：模型剪枝、模型量化、知识蒸馏

VisualXML全新升级 | 新增数据库编辑功能