当前位置：首页 > news >正文

深度学习二维码识别计算机竞赛

news 2026/2/9 8:24:19

文章目录

0 前言
2 二维码基础概念
- 2.1 二维码介绍
- 2.2 QRCode
- 2.3 QRCode 特点
3 机器视觉二维码识别技术
- 3.1 二维码的识别流程
- 3.2 二维码定位
- 3.3 常用的扫描方法
4 深度学习二维码识别
- 4.1 部分关键代码
5 测试结果
6 最后

0 前言

🔥 优质竞赛项目系列，今天要分享的是

🚩 python+opencv+深度学习实现二维码识别

该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！

🥇学长这里给一个题目综合评分(每项满分5分)

难度系数：3分
工作量：3分
创新点：3分

🧿 更多资料, 项目分享：

https://gitee.com/dancheng-senior/postgraduate

2 二维码基础概念

2.1 二维码介绍

二维条码/二维码（2-dimensional bar
code）是用某种特定的几何图形按一定规律在平面（二维方向上）分布的、黑白相间的、记录数据符号信息的图形；在代码编制上巧妙地利用构成计算机内部逻辑基础的“0”、“1”比特流的概念，使用若干个与二进制相对应的几何形体来表示文字数值信息，通过图象输入设备或光电扫描设备自动识读以实现信息自动处理：它具有条码技术的一些共性：每种码制有其特定的字符集；每个字符占有一定的宽度；具有一定的校验功能等。同时还具有对不同行的信息自动识别功能、及处理图形旋转变化点。

2.2 QRCode

常见的二维码为QR Code，QR全称Quick Response，是一个近几年来移动设备上超流行的一种编码方式，它比传统的Bar
Code条形码能存更多的信息，也能表示更多的数据类型。

2.3 QRCode 特点

1、符号规格从版本1（21×21模块）到版本40（177×177 模块），每提高一个版本，每边增加4个模块。

2、数据类型与容量（参照最大规格符号版本40-L级）：

数字数据：7,089个字符
字母数据: 4,296个字符
8位字节数据: 2,953个字符
汉字数据：1,817个字符

3、数据表示方法：

深色模块表示二进制"1"，浅色模块表示二进制"0"。

4、纠错能力：

L级：约可纠错7%的数据码字
M级：约可纠错15%的数据码字
Q级：约可纠错25%的数据码字
H级：约可纠错30%的数据码字

5、结构链接（可选）

可用1-16个QR Code码符号表示一组信息。每一符号表示100个字符的信息。

3 机器视觉二维码识别技术

3.1 二维码的识别流程

在这里插入图片描述

首先，对采集的彩色图像进行灰度化，以提高后继的运行速度。

其次，去除噪声。采用十字形中值滤波去除噪音对二码图像的干扰主要是盐粒噪声。

利用灰度直方图工具，使用迭代法选取适当的阈值，对二维码进行二值化处理，灰度化去噪二值化寻找探测图形确定旋转角度定位旋转
获得数据使其变为白底黑色条码。

最后，确定二维码的位置探测图形，对条码进行定位，旋转至水平后，获得条码数据，
以便下一步进行解码。

3.2 二维码定位

QR 码有三个形状相同的位置探测图形，在没有旋转的情况下，这三个位置探测图形分别位于 QR 码符号的左上角、右上角和左下角。
三个位置探测图形共同组成图像图形。

在这里插入图片描述

每个位置探测图形可以看作是由 3 个重叠的同心的正方形组成，它们分别为 7 7 个深色模块、 5 5 个浅模块和 3*3 个深色模块。
位置探测图形的模块宽度比为 1: 1:3: 1: 1。

在这里插入图片描述

这种 1: 1: 3: 1: 1 的宽度比例特征在图像的其他位置出现的可能性很小，故可以将此作为位置探测图形的扫描特征。基于此特征，
当一条直线上（称为扫描线）被黑白相间地截为1: 1: 3:1: 1 时，可以认为该直线穿过了位置探测图形。

另外，该扫描特征不受图像倾斜的影响。对比中的两个 QR 码符号可以发现，无论 QR码符号是否倾斜，都符合 1: 1: 3:1: 1 的扫描特征。

在这里插入图片描述

3.3 常用的扫描方法

在 X 方向进行依次扫描。

(1) 固定 Y 坐标的取值，在 X 方向上画一条水平直线（称为扫描线）进行扫描。当扫描线被黑白相间地截为 1: 1: 3: 1: 1 时，
可以认为该直线穿过了位置探测图形。在实际判定时，比例系数允许 0. 5 的误差，即比例系数为1 的，允许范围为 0. 5~1. 5，比例系数为 3
的，允许范围为 2. 5~3. 5。

(2) 当寻找到有直线穿过位置探测图形时，记录下位置探测图形的外边缘相遇的第一点和最后一点 A 和 B。由 A、 B
两点为端点的线段称为扫描线段。将扫描线段保存下来。

在这里插入图片描述

用相同的方法，完成图像中所有水平方向的扫描。

在 Y 方向，使用相同的方法，进行垂直扫描，同样保存扫描得到的扫描线段。

扫描线段分类扫描步骤获得的扫描线段是没有经过分类的，也就是对于特定的一条扫描线段，无法获知其具体对应于三个位置探测图形中的哪一个。
在计算位置探测图形中心坐标之前，要将所有的扫描线段按照位置进行归类。一般采用距离邻域法进行扫描线段的分类。

距离邻域法的思想是：给定一个距离阈值 dT, 当两条扫描线段的中点的距离小于 d T 时，认为两条扫描线段在同一个邻域内，将它们分为一类，
反之则归为不同的类别。

距离邻域法的具体步骤如下：
（1）给定一个距离阈值 dT ， d T要求满足以下条件：位于同一个位置探测图形之中的任意两点之间的距离小于 dT ，
位于不同位置探测图形中的任意两点之间的距离大于 d T
（2）新建一个类别，将第 1 条扫描线段归入其中。
（3）对于第 i 条扫描线段 l i （2≤i≤n），做以下操作：

a) 求出 l i 的中点 C i 。

b) 分别计算C i与在已存在的每一个类别中的第一条扫描线段的中点的距离d，若 d＜d T ，则直接将 l i 加入相应类别中。

c) 若无法找到 l i 可以加入的类别，则新建一个类别，将 l i 加入其中。

（4）将所有类别按照包含扫描线段的数目进行从大到小排序，保存前 3 个类别（即
包含扫描线段数目最多的 3 个类别），其余的视为误判得到的扫描线段（在位置探测图形以外的位置得到的符合扫描特征的扫描线段），
直接舍去。距离邻域法结束后得到的分好 3 个类别的扫描线段就分别对应了 3 个位置探测图形。距离邻域法的关键就是距离阈值的选取。一般对于不同大小的 QR
码图像，要使用不同的距离阈值。

（1）在 X 方向的扫描线段中找出最外侧的两条，分别取中点，记为 A、 B。由 A、 B两点连一条直线。
在这里插入图片描述

（2）在 Y 方向的扫描线段中找出最外侧的两条，分别取中点，记为 C、 D。由 C、 D两点连一条直线。
在这里插入图片描述

（3）计算直线 AB 与直线 CD 的交点 O，即为位置探测图形中心点。

在这里插入图片描述

将 QR 码符号的左上、右上位置探测图形的中心分别记为 A、 B。连接 A、 B。直线 AB 与水平线的夹角α 即为 QR 码符号的旋转角度。

在这里插入图片描述
对于该旋转角度α ，求出其正弦值 sinα 与余弦值 cosα 即可。具体计算公式如下：

在这里插入图片描述

位置探测图形边长的计算是基于无旋转图像的，在无旋转图像中，水平扫描线段的长度即为位置探测图形的边长。

水平扫描线段 AB 的长度即为位置探测图形的边长 X。

在这里插入图片描述

对于经过旋转的 QR 码图像，先通过插值算法生成旋正的 QR 码图像，然后按照如上所述的方法进

4 深度学习二维码识别

基于 CNN 的二维码检测，网络结构如下

在这里插入图片描述

4.1 部分关键代码

篇幅有限，学长在这只给出部分关键代码

首先，定义一个 AlgoQrCode.h

#pragma once
#include 
#include 
using namespace cv;
using namespace std;class AlgoQRCode
{
private:Ptr<wechat_qrcode::WeChatQRCode> detector;public:bool initModel(string modelPath);string detectQRCode(string strPath);bool compression(string inputFileName, string outputFileName, int quality);void release();
};

该头文件定义了一些方法，包含了加载模型、识别二维码、释放资源等方法，以及一个 detector 对象用于识别二维码。

然后编写对应的源文件 AlgoQrCode.cpp

bool AlgoQRCode::initModel(string modelPath) {string detect_prototxt = modelPath + "detect.prototxt";string detect_caffe_model = modelPath + "detect.caffemodel";string sr_prototxt = modelPath + "sr.prototxt";string sr_caffe_model = modelPath + "sr.caffemodel";try{detector = makePtr<wechat_qrcode::WeChatQRCode>(detect_prototxt, detect_caffe_model, sr_prototxt, sr_caffe_model);}catch (const std::exception& e){cout << e.what() << endl;return false;}return true;
}string AlgoQRCode::detectQRCode(string strPath)
{if (detector == NULL) {return "-1";}vector<Mat> vPoints;vector<cv::String> vStrDecoded;Mat imgInput = imread(strPath, IMREAD_GRAYSCALE);
//	vStrDecoded = detector->detectAndDecode(imgInput, vPoints);....
}bool AlgoQRCode::compression(string inputFileName, string outputFileName, int quality) {Mat srcImage = imread(inputFileName);if (srcImage.data != NULL){vector<int>compression_params;compression_params.push_back(IMWRITE_JPEG_QUALITY);compression_params.push_back(quality);     //图像压缩参数，该参数取值范围为0-100，数值越高，图像质量越高bool bRet = imwrite(outputFileName, srcImage, compression_params);return bRet;}return false;
}void AlgoQRCode::release() {detector = NULL;
}

5 测试结果

学长这里放到树莓派中，调用外部摄像头进行识别，可以看到，效果还是非常不错的

在这里插入图片描述

6 最后

🧿 更多资料, 项目分享：

https://gitee.com/dancheng-senior/postgraduate

深度学习二维码识别计算机竞赛

文章目录 0 前言2 二维码基础概念2.1 二维码介绍2.2 QRCode2.3 QRCode 特点 3 机器视觉二维码识别技术3.1 二维码的识别流程3.2 二维码定位3.3 常用的扫描方法 4 深度学习二维码识别4.1 部分关键代码 5 测试结果6 最后 0 前言 🔥 优质竞赛项目系列，今天…...

编程日记 2023/11/21 2:11:20

C#关于TimeSpan结构的使用和获取两个时间差

C#中的TimeSpan结构可以获取两个时间的时间差。它主要具有以下属性和方法： 属性： Days：获取时间间隔的天数部分。Hours：获取时间间隔的小时数部分（不包括整天的小时数）。Minutes：获取时间间…...

编程日记 2023/11/21 2:09:16

Git分支管理

愿所有美好如期而遇目录理解分支创建分支切换分支合并分支删除分支合并冲突分支管理策略理解分支每次提交master都会前进一步，随着不断提交，master分支的线越来越长，而HEAD指向哪条分支就是当前工作的分支。 master分支是我…...

编程日记 2023/11/21 2:08:14

《视觉SLAM十四讲》-- 建图

11 建图 11.1 概述 （1）地图的几类用处： 定位：导航：机器人在地图中进行路径规划；避障重建交互：人与地图之间的互动 （2）几类地图稀疏地图稠密地图语义地图 11.2 单目…...

编程日记 2023/11/21 2:07:13

智能配电箱柜管理系统

智能配电箱柜管理系统是一个综合性的管理系统，专门设计用于监控和控制智能配电箱和柜的运行。这个系统集成了先进的技术和智能化功能，以确保配电系统的正常运行并提高其效率。依托电易云-智慧电力物联网，以下是智能配电箱柜管理系统的主要特点…...

编程日记 2023/11/21 2:06:12

聊聊近些年 CPU 在微架构、IO 速率上的演进过程

大家好，我是飞哥！ 在上一篇《深入了解 CPU 的型号、代际架构与微架构》中我们介绍了我手头的一颗 Intel(R) Core(TM) i5 的型号规则，以及它的物理硬件的 Die 图结构。以及它对应的 Skylake 核的微架构实现。不少同学开始问我其它型号的 CPU…...

编程日记 2023/11/21 2:05:11

PS学习笔记——移动工具

文章目录介绍文档内移动文档间移动介绍移动工具：用于移动图层中的对象，并且同一图层中的所有对象都将一起移动选中移动工具后，选项栏中会出现“显示变换控件”，勾选后即可看见图层中的对象周围出现边框，可以进行缩…...

编程日记 2023/11/21 2:04:09

信息中心网络提出的背景、研究现状及研究内容

信息中心网络什么时候提出的？未来发展前景？有什么著名实验室在做？ 1、提出背景： 互联网产生于上世纪60年代： （1）网络设备数量呈指数性增长截至2022年底全球范围内预计将有超过280亿台终端设…...

编程日记 2023/11/21 2:01:06

【计算机视觉】24-Object Detection

文章目录 24-Object Detection1. Introduction2. Methods2.1 Sliding Window2.2 R-CNN: Region-Based CNN2.3 Fast R-CNN2.4 Faster R-CNN: Learnable Region Proposals2.5 Results of objects detection 3. SummaryReference 24-Object Detection 1. Introduction Task Defin…...

编程日记 2023/11/21 1:59:03

【mac 解决eclipse意外退出】

打开eclipse时提示报错信息应用程序"Eclipse.app"无法打开（这里忘了截图就不上图了）。点击 “好” 的按钮后会弹出发送报告的弹窗终端输入：sudo codesign --force --deep --sign - /Applications/Eclipse.app/ 就可以解决了...

编程日记 2023/11/21 1:58:02

mysql innodb buffer pool缓冲池命中率和命中了哪些表？—— 筑梦之路

环境说明 mysql 5.7及以上公式 # InnoDB缓冲区缓存的命中率计算公式100 * (1 - (innodb_buffer_pool_reads/innodb_buffer_pool_read_requests ))注意: 对于具有大型缓冲池的系统，既要关注该比率，也要关注OS页面读写速率的变化可以更好地跟踪差异。s…...

编程日记 2023/11/21 1:57:01

牛掰的dd命令，cpi0配合find备份（不会主动备份），od查看

dd if设备1或文件 of设备2或文件 blocknsize countn 还原就是把设备1,2调过来这里想到dump的还原是命令restore，想起来就写一下，省的总忘记可以针对整块磁盘进行复制，对于新创建的分区，也不用格式化，可以直接…...

编程日记 2023/11/21 1:56:00

pip list 和 conda list的区别

PS : 网上说conda activate了之后就可以随意pip了可以conda和pip混用但是安全起见还是尽量用pip 这样就算activate了，进入base虚拟环境了 conda与pip的区别来源 Conda和pip通常被认为几乎完全相同。虽然这两个工具的某些功能重叠，但它们设计用于不…...

编程日记 2023/11/21 1:53:57

多目标应用：基于多目标灰狼优化算法MOGWO求解微电网多目标优化调度（MATLAB代码）

一、微网系统运行优化模型微电网优化模型介绍： 微电网多目标优化调度模型简介_IT猿手的博客-CSDN博客二、多目标灰狼优化算法MOGWO 多目标灰狼优化算法MOGWO简介： 三、多目标灰狼优化算法MOGWO求解微电网多目标优化调度 （1&#xff09…...

编程日记 2023/11/21 1:52:56

LangChain 2模块化prompt template并用streamlit生成网站实现给动物取名字

上一节实现了 LangChain 实现给动物取名字， 实际上每次给不同的动物取名字，还得修改源代码，这周就用模块化template来实现。 1. 添加promptTemplate from langchain.llms import OpenAI # 导入Langchain库中的OpenAI模块 from langchain.p…...

编程日记 2023/11/21 1:51:55

linux nas

挂载到本地 mkdir -p /mnt/mountnasdir mount -t nfs 192.168.62:/cnas_id10086_vol10010_dev/ /mnt/mountnasdir...

编程日记 2023/11/21 1:50:54

控制您的音乐、视频等媒体内容

跨多个 Chrome 标签页播放音乐或声音在计算机上打开 Chrome 。在标签页中播放音乐、视频或其他任何有声内容。您可以停留在该标签页上，也可以转到别处。要控制声音，请在右上角点击“媒体控件”图标。您可暂停播放、转到下一首歌曲/下一个视频&#xf…...

编程日记 2023/11/21 1:49:53

xlua源码分析（三）C#访问lua的映射

xlua源码分析（三）C#访问lua的映射上一节我们主要分析了lua call C#的无wrap实现。同时我们在第一节里提到过，C#使用LuaTable类持有lua层的table，以及使用Action委托持有lua层的function。而在xlua的官方文档中，推荐使…...

编程日记 2023/11/21 1:48:52

2023 极术通讯-汽车“新四化”路上，需要一片安全山海

导读：极术社区推出极术通讯，引入行业媒体和技术社区、咨询机构优质内容，定期分享产业技术趋势与市场应用热点。芯方向【Armv9】-动态TrustZone技术的介绍动态 TrustZone 是提供多租户安全媒体 pipeline 的绝佳工具。完全不受操作系统、虚…...

编程日记 2023/11/21 1:47:51

Spring Boot接口设计规范

接口参数处理及统一结果响应 1、接口参数处理 1、普通参数接收这种参数接收方式是比较常见的，由于是GET请求方式，所以在传参时直接在路径后拼接参数和参数值即可。例如：localhost:8080/api/product/list?key1value1&key2value2 /…...

编程日记 2023/11/21 1:46:48

Spark 之入门讲解详细版（1）

1、简介 1.1 Spark简介 Spark是加州大学伯克利分校AMP实验室（Algorithms, Machines, and People Lab）开发通用内存并行计算框架。Spark在2013年6月进入Apache成为孵化项目，8个月后成为Apache顶级项目，速度之快足见过人之处&…...

编程新知 2026/2/5 4:17:31

深入理解JavaScript设计模式之单例模式

目录什么是单例模式为什么需要单例模式常见应用场景包括单例模式实现透明单例模式实现不透明单例模式用代理实现单例模式javaScript中的单例模式使用命名空间使用闭包封装私有变量惰性单例通用的惰性单例结语什么是单例模式单例模式（Singleton Pattern&#…...

编程新知 2026/1/31 17:09:43

基于Uniapp开发HarmonyOS 5.0旅游应用技术实践

一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架，支持"一次开发，多端部署"，可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务，为旅游应用带来&#xf…...

编程新知 2026/2/5 20:33:43

从零开始打造 OpenSTLinux 6.6 Yocto 系统（基于STM32CubeMX）（九）

设备树移植和uboot设备树修改的内容同步到kernel将设备树stm32mp157d-stm32mp157daa1-mx.dts复制到内核源码目录下源码修改及编译修改arch/arm/boot/dts/st/Makefile，新增设备树编译 stm32mp157f-ev1-m4-examples.dtb \stm32mp157d-stm32mp157daa1-mx.dtb修改…...

编程新知 2026/2/5 12:11:18

leetcodeSQL解题：3564. 季节性销售分析

leetcodeSQL解题：3564. 季节性销售分析题目： 表：sales ---------------------- | Column Name | Type | ---------------------- | sale_id | int | | product_id | int | | sale_date | date | | quantity | int | | price | decimal | -…...

编程新知 2025/10/5 19:58:27

《基于Apache Flink的流处理》笔记

思维导图 1-3 章 4-7章 8-11 章参考资料源码： https://github.com/streaming-with-flink 博客 https://flink.apache.org/bloghttps://www.ververica.com/blog 聚会及会议 https://flink-forward.orghttps://www.meetup.com/topics/apache-flink https://n…...

编程新知 2026/1/31 14:55:53

CRMEB 框架中 PHP 上传扩展开发：涵盖本地上传及阿里云 OSS、腾讯云 COS、七牛云

目前已有本地上传、阿里云OSS上传、腾讯云COS上传、七牛云上传扩展扩展入口文件文件目录 crmeb\services\upload\Upload.php namespace crmeb\services\upload;use crmeb\basic\BaseManager; use think\facade\Config;/*** Class Upload* package crmeb\services\upload* …...

编程新知 2025/12/30 22:56:56

第 86 场周赛：矩阵中的幻方、钥匙和房间、将数组拆分成斐波那契序列、猜猜这个单词

Q1、[中等] 矩阵中的幻方 1、题目描述 3 x 3 的幻方是一个填充有从 1 到 9 的不同数字的 3 x 3 矩阵，其中每行，每列以及两条对角线上的各数之和都相等。给定一个由整数组成的row x col 的 grid，其中有多少个 3 3 的 “幻方” 子矩阵&am…...

编程新知 2026/2/7 13:27:36

GC1808高性能24位立体声音频ADC芯片解析

1. 芯片概述 GC1808是一款24位立体声音频模数转换器（ADC），支持8kHz~96kHz采样率，集成Δ-Σ调制器、数字抗混叠滤波器和高通滤波器，适用于高保真音频采集场景。 2. 核心特性高精度：24位分辨率&#xff0c…...

编程新知 2026/1/27 4:58:14

C++.OpenGL （14/64）多光源（Multiple Lights）

多光源（Multiple Lights）多光源渲染技术概览 #mermaid-svg-3L5e5gGn76TNh7Lq {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-3L5e5gGn76TNh7Lq .error-icon{fill:#552222;}#mermaid-svg-3L5e5gGn76TNh7Lq .erro…...

编程新知 2025/6/11 3:15:20

文章目录

0 前言

2 二维码基础概念

2.1 二维码介绍

2.2 QRCode

2.3 QRCode 特点

3 机器视觉二维码识别技术

3.1 二维码的识别流程

3.2 二维码定位

3.3 常用的扫描方法

4 深度学习二维码识别

4.1 部分关键代码

5 测试结果

6 最后

相关文章：