当前位置：首页 > news >正文

Paddle OCR Win 11下的安装和简单使用教程

news 2026/2/10 13:39:31

Paddle OCR Win 11下的安装和简单使用教程

对于中文的识别，可以考虑直接使用Paddle OCR，识别准确率和部署都相对比较方便。

环境搭建

目前PaddlePaddle 发布到v2.4，先下载paddlepaddle，再下载paddleocr。根据自己设备操作系统进行下载安装。paddle官网地址：https://www.paddlepaddle.org.cn

在这里插入图片描述

pip install paddlepaddle-gpu==2.4.2.post112 -f https://www.paddlepaddle.org.cn/whl/windows/mkl/avx/stable.html

如果需要CPU版本：

pip install paddlepaddle -i https://mirror.baidu.com/pypi/simple

paddleocr 推荐环境

PaddlePaddle >= 2.1.2

Python 3.7

CUDA 10.1 / CUDA 10.2

CUDNN 7.6

可参考paddle官方出的环境搭建进行，地址：https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.6/doc/doc_ch/environment.md

安装paddle ocr

pip install paddleocr -i https://mirror.baidu.com/pypi/simple

对于直接pip shapely库可能出现的问题[winRrror 126]，建议下载shapely安装包完成安装。地址：https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely

使用教程

在环境搭建好之后，就可以愉快的直接使用了。话说，两年没用paddle，跟torch越来越像了。

import paddle
import paddleocr
from paddleocr import PaddleOCR
import numpy as np
import cv2
import matplotlib.pyplot as plt
import os
from PIL import Image
import glob
import random
import re
import jsonprint(paddle.__version__)
#2.4.1
print(paddleocr.__version__)
#2.6.1.3

使用PaddleOCR，默认使用的是PP-OCRv3，轻量级模型。

源代码：

SUPPORT_DET_MODEL = ['DB']
VERSION = '2.6.1.0'
SUPPORT_REC_MODEL = ['CRNN', 'SVTR_LCNet']
BASE_DIR = os.path.expanduser("~/.paddleocr/")DEFAULT_OCR_MODEL_VERSION = 'PP-OCRv3'

OCR model用的PP-OCRv3，根据论文，检测用的DB，识别用的SVTR。相比PP-OCRv2，模型框架如下图：

在这里插入图片描述

ocr = PaddleOCR(use_angles_cls=True, use_gpu=False)def draw_img(img_path,boxes):save_root = 'data/resocr/'img_name = img_path.split('\\')[1]img = cv2.imread(img_path)for box in boxes:box = np.reshape(np.array(box),[-1,1,2]).astype(np.int64)img = cv2.polylines(np.array(img), [box], True, (255,0,0),2)plt.figure(figsize=(10,10))save_file = save_root+img_nameplt.imshow(img)plt.savefig(save_file)imgp = 'data\\idcard1.png'
print(ocr.args)
res = ocr.ocr(imgp)
print(res)
boxes = []
texts = []
for j in range(len(res[0])):boxes.append(res[0][j][0])texts.append(res[0][j][1][0])
draw_img(imgp,boxes)

网上随便找了一张奥巴马身份证，得到的结果如下：（写了才发现，包自带了一个draw_ocr的函数）

在这里插入图片描述

部分结果：

[[[[[350.0, 16.0], [819.0, 16.0], [819.0, 58.0], [350.0, 58.0]],('上海增值税电子普通发票', 0.9431300759315491)],[[[864.0, 38.0], [1060.0, 41.0], [1060.0, 62.0], [864.0, 59.0]],('发票代码：031001600311', 0.9889101982116699)],[[[864.0, 71.0], [1024.0, 71.0], [1024.0, 92.0], [864.0, 92.0]],('发票号码：81471594', 0.9445592164993286)],[[[864.0, 102.0], [1074.0, 98.0], [1074.0, 119.0], [864.0, 123.0]],('开票日期：2017年11月13日', 0.9694705009460449)],[[[535.0, 115.0], [633.0, 112.0], [634.0, 139.0], [536.0, 142.0]],('上海市税务局', 0.9940652847290039)],[[[6.0, 134.0], [201.0, 138.0], [201.0, 155.0], [6.0, 151.0]],('机器编号：499099774351', 0.9102509021759033)],[[[864.0, 132.0], [1164.0, 129.0], [1164.0, 150.0], [864.0, 153.0]],('校验码：01519962196503160071', 0.9772385954856873)]]]

可以看到基本该拿的信息都拿了。可以通过调节超参对检测框阈值和比例进行调节。根据utility.py参数初始化设置如下：

 # DB parmasparser.add_argument("--det_db_thresh", type=float, default=0.3) #二值化输出图的阈值parser.add_argument("--det_db_box_thresh", type=float, default=0.6) #过滤检测框阈值parser.add_argument("--det_db_unclip_ratio", type=float, default=1.5) #检测框扩张的系数

ocr = PaddleOCR(use_angles_cls=True, use_gpu=False, det_db_thresh=0.3,det_db_unclip_ratio=2.5, det_db_box_thresh=0.8)

更改参数后看看结果：

过滤掉了一些检测框。

在这里插入图片描述

参数可以根据自己所处的任务进行调节，也可以选择其他模型进行增加识别率。

paddle现在跟torch很像，也就减少了学习成本。

官方出了一个Dive into OCR的教程，有点儿狗的是，中文版要进群后才能领取。英文版则大方给出来了，地址如下：https://paddleocr.bj.bcebos.com/ebook/Dive_into_OCR.pdf

Paddle OCR Win 11下的安装和简单使用教程

Paddle OCR Win 11下的安装和简单使用教程对于中文的识别，可以考虑直接使用Paddle OCR，识别准确率和部署都相对比较方便。环境搭建目前PaddlePaddle 发布到v2.4，先下载paddlepaddle，再下载paddleocr。根据自己设备操作系统进…...

编程日记 2023/3/2 2:08:42

杂谈：数组index问题和对象key问题

面试题一： var arr [1, 2, 3, 4] 问：arr[1] ?; arr[1] ?答：arr[1] 2; arr[1] 2 这里可以再分为两个问题： 1、数组赋值 var arr [1, 2, 3, 4]arr[1] 10; // 数字场景 arr[10] 1; // 字符串场景 arr[a] 1; // 字符串…...

编程日记 2023/3/2 2:07:17

三天Golang快速入门—Slice切片

三天Golang快速入门—Slice切片Slice切片切片原理切片遍历append函数操作切片append添加append追加多个切片中删除元素切片合并string和slice的联系Slice切片切片原理由三个部分构成，指针、长度、容量指针：指向slice第一个元素对应的数组元素的地址长…...

编程日记 2023/3/2 2:06:00

腾讯会议演示者视图/演讲者视图

前言使用腾讯会议共享PPT时，腾讯会议支持共享用户使用演示者视图/演讲者视图，而会议其他成员可以看到正常的放映视图。下面以Win10系统和Office为例，介绍使用步骤。值得一提的是，该方法同时适用于单显示屏和多显示屏。腾讯会议…...

编程日记 2023/3/2 2:04:48

【C++】类与对象（一）

文章目录1、面向过程和面向对象初步认识2、类的引入3、类的定义4、类的访问限定符5、类的作用域6、类的实例化7、计算类对象的大小8、this指针9、 C语言和C实现Stack的对比1、面向过程和面向对象初步认识 C语言是面向过程的，关注的是过程，分析出求解问题…...

编程日记 2023/3/2 2:03:14

JavaScript基本语法

本文提到的绝大多数语法都是与Java不同的语法,相同的就不会赘述了.JavaScript的三种引入方式内部js<body><script>alert(hello);</script> </body>行内js<body><div onclick"alert(hello)">这是一个div 点击一下试试</div>…...

编程日记 2023/3/2 2:02:04

OpenCV4.x图像处理实例-道路车辆检测(基于背景消减法)

通过背景消减进行道路车辆检测文章目录通过背景消减进行道路车辆检测1、车辆检测思路介绍2、BackgroundSubtractorMOG23、车辆检测实现在本文中，将介绍如何使用简单但有效的背景-前景减法方法执行车辆检测等任务。本文将使用 OpenCV 中使用背景-前景减法和轮廓检测，以及如何…...

编程日记 2023/3/2 2:00:57

pwnlab通关流程

pwnlab通关关于文件包含，环境变量劫持的一个靶场信息收集靶机ip：192.168.112.133 开放端口根据开放的端口信息决定从80web端口入手目录信息在images和upload路径存在目录遍历，config.php被渲染无法查看，upload.php需…...

编程日记 2023/3/2 1:59:50

面向过程与面向对象的区别与联系

目录什么是面向过程什么是面向对象区别各自的优缺点什么是面向过程面向过程是一种以事件为中心的编程思想，编程的时候把解决问题的步骤分析出来，然后用函数把这些步骤实现，在一步一步的具体步骤中再按顺序调用函数。什么是面向对…...

编程日记 2023/3/2 1:58:42

主机状态（查看资源占用情况、查看网络占用情况）

1. 查看资源占用情况【1】可以通过top命令查看cpu、内存的使用情况，类似windows的任务管理器默认5s刷新一次语法：top 可 Ctrl c 退出 2.磁盘信息监控【1】使用df命令，查看磁盘信息占用情况语法：df [ -h ] 以更加人性化…...

编程日记 2023/3/2 1:57:34

代码随想录算法训练营第四十一天 | 01背包问题-二维数组滚动数组，416. 分割等和子集

一、参考资料01背包问题二维 https://programmercarl.com/%E8%83%8C%E5%8C%85%E7%90%86%E8%AE%BA%E5%9F%BA%E7%A1%8001%E8%83%8C%E5%8C%85-1.html 视频讲解：https://www.bilibili.com/video/BV1cg411g7Y6 01背包问题一维 https://programmercarl.com/%E8%83%8C%E5…...

编程日记 2023/3/2 1:56:28

VMware NSX 4.1 发布 - 网络安全虚拟化平台

请访问原文链接：VMware NSX 4 - 网络安全虚拟化平台，查看最新版。原创作品，转载请保留出处。作者主页：www.sysin.org VMware NSX 提供了一个敏捷式软件定义基础架构，用来构建云原生应用程序环境。NSX 专注于为具有异…...

编程日记 2023/3/2 1:55:20

计算理论复杂度预备知识

文章目录计算理论复杂度预备知识符号递归表达式求解通项公式主方法Akra-Bazzi 定理计算理论复杂度预备知识符号 f(n)o(g(n))f(n)o(g(n))f(n)o(g(n)) ：∃c\exists c∃c ，当 nnn 足够大时， f(n)<cg(n)f(n)\lt cg(n)f(n)<cg(n) &#…...

编程日记 2023/3/2 1:54:11

二叉树——二叉搜索树中的插入操作

二叉搜索树中的插入操作链接给定二叉搜索树（BST）的根节点 root 和要插入树中的值 value ，将值插入二叉搜索树。返回插入后二叉搜索树的根节点。输入数据保证 ，新值和原始二叉搜索树中的任意节点值都不同。注意&#xff0c…...

编程日记 2023/3/2 1:53:06

C# if break,if continue,if return的区别和使用

故事部分： 现在你肚子饿了，想要去： 1.吃个三菜一汤。 2.吃个蛋糕。 3.喝个奶茶。结果，你吃饭的时候，吃到一个虫子。你会有几种做法？ 1.把有虫子这道菜拿走，继续吃下一道菜。 2.算了&#xff…...

编程日记 2023/3/2 1:52:01

力扣-第二高的薪水

大家好，我是空空star，本篇带大家了解一道中等的力扣sql练习题。文章目录前言一、题目：176. 第二高的薪水二、解题1.正确示范①提交SQL运行结果2.正确示范②提交SQL运行结果3.正确示范③提交SQL运行结果4.正确示范④提交SQL运行结果5.其他总结…...

编程日记 2023/3/2 1:50:55

I - 太阳轰炸(组合数学Cnk n固定)

2023河南省赛组队训练赛（二） - Virtual Judge (vjudge.net) 背景：阿塔尼斯，达拉姆的大主教，在艾尔又一次沦陷之后指挥着星灵的最后一艘方舟舰：亚顿之矛。作为艾尔星灵数千年来的智慧结晶，亚顿之…...

编程日记 2023/3/2 1:49:51

centos安装gitlab

更新系统 sudo yum -y update安装所需要的包 sudo yum -y install epel-release curl vim policycoreutils-python如果要安装并使用本地Postfix服务器发送通知，请安装Postfix，这里就不安装了： sudo yum -y install postfix安装后启动并启用…...

编程日记 2023/3/2 1:48:44

【洛谷 P1093】[NOIP2007 普及组] 奖学金题解（结构体排序）

[NOIP2007 普及组] 奖学金题目描述某小学最近得到了一笔赞助，打算拿出其中一部分为学习成绩优秀的前 555 名学生发奖学金。期末，每个学生都有 333 门课的成绩:语文、数学、英语。先按总分从高到低排序，如果两个同学总分相同，再…...

编程日记 2023/3/2 1:47:37

【Hello Linux】进程优先级和环境变量

作者：小萌新专栏：Linux 作者简介：大二学生希望能和大家一起进步！ 本篇博客简介：简单介绍下进程的优先级环境变量进程优先级环境变量进程的优先级基本概念如何查看优先级PRI与NINI值的设置范围NI值如何修改修改方式…...

编程日记 2023/3/2 1:46:33

椭圆曲线密码学(ECC)

一、ECC算法概述椭圆曲线密码学（Elliptic Curve Cryptography）是基于椭圆曲线数学理论的公钥密码系统，由Neal Koblitz和Victor Miller在1985年独立提出。相比RSA，ECC在相同安全强度下密钥更短（256位ECC ≈ 3072位RSA…...

编程新知 2025/10/1 22:26:06

SciencePlots——绘制论文中的图片

文章目录安装一、风格二、1 资源安装 # 安装最新版 pip install githttps://github.com/garrettj403/SciencePlots.git# 安装稳定版 pip install SciencePlots一、风格简单好用的深度学习论文绘图专用工具包–Science Plot 二、 1 资源论文绘图神器来了：一行…...

编程新知 2025/9/8 13:50:07

（二）TensorRT-LLM | 模型导出（v0.20.0rc3）

0. 概述上一节对安装和使用有个基本介绍。根据这个 issue 的描述，后续 TensorRT-LLM 团队可能更专注于更新和维护 pytorch backend。但 tensorrt backend 作为先前一直开发的工作，其中包含了大量可以学习的地方。本文主要看看它导出模型的部分&#x…...

编程新知 2026/1/24 6:44:11

linux 错误码总结

1，错误码的概念与作用在Linux系统中，错误码是系统调用或库函数在执行失败时返回的特定数值，用于指示具体的错误类型。这些错误码通过全局变量errno来存储和传递，errno由操作系统维护，保存最近一次发生的错误信息。值得注意的是，errno的值在每次系统调用或函数调用失败时…...

编程新知 2025/9/16 22:48:47

C++八股 —— 单例模式

文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念线程安全（Thread Safety） 线程安全是指在多线程环境下，某个函数、类或代码片段能够被多个线程同时调用时，仍能保证数据的一致性和逻辑的正确性&#xf…...

编程新知 2025/12/2 3:35:50

3-11单元格区域边界定位(End属性)学习笔记

返回一个Range 对象，只读。该对象代表包含源区域的区域上端下端左端右端的最后一个单元格。等同于按键 End 向上键(End(xlUp))、End向下键(End(xlDown))、End向左键(End(xlToLeft)End向右键(End(xlToRight)) 注意：它移动的位置必须是相连的有内容的单元格…...

编程新知 2026/2/9 15:39:14

Web 架构之 CDN 加速原理与落地实践

文章目录一、思维导图二、正文内容（一）CDN 基础概念1. 定义2. 组成部分 （二）CDN 加速原理1. 请求路由2. 内容缓存3. 内容更新 （三）CDN 落地实践1. 选择 CDN 服务商2. 配置 CDN3. 集成到 Web 架构 &#xf…...

编程新知 2025/9/13 16:17:01

深度学习之模型压缩三驾马车：模型剪枝、模型量化、知识蒸馏

一、引言在深度学习中，我们训练出的神经网络往往非常庞大（比如像 ResNet、YOLOv8、Vision Transformer），虽然精度很高，但“太重”了，运行起来很慢，占用内存大，不适合部署到手机、摄…...

编程新知 2025/9/24 3:56:34

Python 训练营打卡 Day 47

注意力热力图可视化在day 46代码的基础上，对比不同卷积层热力图可视化的结果 import torch import torch.nn as nn import torch.optim as optim from torchvision import datasets, transforms from torch.utils.data import DataLoader import matplotlib.pypl…...

编程新知 2025/11/24 9:42:16

解析两阶段提交与三阶段提交的核心差异及MySQL实现方案

引言在分布式系统的事务处理中，如何保障跨节点数据操作的一致性始终是核心挑战。经典的两阶段提交协议（2PC）通过准备阶段与提交阶段的协调机制，以同步决策模式确保事务原子性。其改进版本三阶段提交协议（3PC&#xf…...

编程新知 2026/2/7 9:17:02

Paddle OCR Win 11下的安装和简单使用教程

环境搭建

如果需要CPU版本：

paddleocr 推荐环境

安装paddle ocr

使用教程

源代码：

部分结果：

更改参数后看看结果：

官方出了一个Dive into OCR的教程，有点儿狗的是，中文版要进群后才能领取。英文版则大方给出来了，地址如下：https://paddleocr.bj.bcebos.com/ebook/Dive_into_OCR.pdf

相关文章：