OpenCV答题卡识别
文章目录
- 一、基本流程
- 二、代码实现
- 1.定义函数
- 2.图像预处理
- (1)高斯模糊、边缘检测
- (2)轮廓检测
- (3)透视变换
- (4)阈值处理和轮廓检测
- 3.筛选和排序选项轮廓
- 4.判断答案
- 5.显示结果
- 三、总结
OpenCV在答题卡识别中发挥着重要作用,它能够通过一系列图像处理技术,实现对答题卡的自动识别,并进行答题结果的统计。以下是一个基于OpenCV的答题卡识别的基本流程和关键步骤:
一、基本流程
- 图片读取:首先,使用OpenCV读取答题卡的图像文件。
- 图片预处理:对读取的图像进行预处理,包括灰度化、滤波去噪、边缘检测等,以突出答题卡中的关键信息。
- 轮廓检测:通过轮廓检测算法,找到答题卡中各个选项或区域的轮廓。
- 透视变换:对检测到的轮廓进行透视变换,以校正答题卡的视角,使其更加符合后续处理的需求。
- 阈值处理:对校正后的图像进行阈值处理,将图像转换为二值图像,便于后续的分析和识别。
- 答题区域识别:在二值图像中,识别出答题卡上的各个答题区域。
- 答题结果判断:根据答题区域的填充情况,判断答题结果,并与正确答案进行对比,计算答题正确率。
二、代码实现
1.定义函数
import numpy as np
import cv2ANSWER_KEY = {0: 1, 1: 4, 2: 0, 3: 3, 4: 1}def cv_show(name, img):cv2.imshow(name, img)cv2.waitKey(60)def order_points(pts):rect = np.zeros((4, 2), dtype='float32') # 用来存储排序之后的坐标位置# 按顺序找到对应华标0123分别是左上,右上,右下,左下s = pts.sum(axis=1)rect[0] = pts[np.argmin(s)]rect[2] = pts[np.argmax(s)]diff = np.diff(pts, axis=1)rect[1] = pts[np.argmin(diff)]rect[3] = pts[np.argmax(diff)]return rectdef four_point_transform(image, pts):rect = order_points(pts)(tl, tr, br, bl) = rectwidthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))maxWidth = max(int(widthA), int(widthB))heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))maxHeight = max(int(heightA), int(heightB))# 变换后对应坐标位置dst = np.array([[0, 0], [maxWidth - 1, 0],[maxWidth - 1, maxHeight - 1], [0, maxHeight - 1]], dtype='float32')M = cv2.getPerspectiveTransform(rect, dst) # 计算从原始四边形到目标矩形的透视变换矩阵 M。warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight)) # 应用透视变换矩阵 M 到原始图像 image 上,对图像透视变换return warpeddef sort_contours(cnts, method='left-to-right'):reverse = Falsei = 0if method == 'right-to-left' or method == 'bottom-to-top':reverse = Trueif method == 'top-to-bottom' or method == 'bottom-to-top':i = 1boundingBoxes = [cv2.boundingRect(c) for c in cnts](cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),key=lambda b: b[1][i], reverse=reverse))return cnts, boundingBoxes
定义答案密钥:
- ANSWER_KEY 是一个字典,存储了每个问题的正确答案(在这个例子中,只有5个问题,但密钥是通用的,可以扩展到更多问题)。
定义辅助函数:
- cv_show(name, img):显示图像,并在指定时间后关闭窗口。
- order_points(pts):根据轮廓点的坐标,将它们排序为左上、右上、右下、左下的顺序,以便进行透视变换。
- four_point_transform(image, pts):使用四个点进行透视变换,将图像校正为矩形。
- sort_contours(cnts,method=‘left-to-right’):根据指定的方法(从左到右、从右到左、从上到下、从下到上)对轮廓进行排序。
2.图像预处理
(1)高斯模糊、边缘检测
image = cv2.imread(r'./images/test_01.png')
contours_img = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
blurred = cv2.GaussianBlur(gray, (5, 5), 0) # 对图像进行高斯模糊
# (5,5)表示高斯核函数,决定模糊程度,越大越模糊,0表示自动计算标准差。
cv_show('blurred', blurred)
edged = cv2.Canny(blurred, 75, 200) # 边缘检测
cv_show('edged', edged)
读取答题卡图像,将图像转换为灰度图,然后应用高斯模糊来减少噪声并使用Canny边缘检测来找到图像中的边缘。打印图片如下:

(2)轮廓检测
cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1] # cv2.RETR_EXTERNAL 轮廓检索,只检索最外层轮廓。
cv2.drawContours(contours_img, cnts, -1, (0, 0, 255), 3) # 绘制轮廓,在contours_img中绘制检索的轮廓
cv_show('conyours_img', contours_img)
docCnt = None
cv2.waitKey(10000)cnts = sorted(cnts, key=cv2.contourArea, reverse=True) # 通过轮廓面积对轮廓进行由大到小排序
for c in cnts:peri = cv2.arcLength(c, True) # 计算闭合轮廓的周长approx = cv2.approxPolyDP(c, 0.02 * peri, True) # 对轮廓进行多边逼近if len(approx) == 4: # 如果结果为四边形docCnt = approxbreak
在边缘检测后的图像中找到外部轮廓并进行绘制,根据轮廓面积对轮廓进行排序,找到最大的轮廓。使用approxPolyDP函数对轮廓进行多边形逼近,如果结果是四边形,则认为这是答题卡的轮廓。图像如下:

(3)透视变换
warped_t = four_point_transform(image, docCnt.reshape(4, 2)) # 调用函数进行图像透视变换
warped_new = warped_t.copy()
cv_show('warped', warped_t)
调用上述定义的函数four_point_transform,使用找到的答题卡轮廓的四个角点进行透视变换,将答题卡校正为矩形。图像如下:

(4)阈值处理和轮廓检测
warped = cv2.cvtColor(warped_t, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(warped, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1] # 对图像进行阈值处理
cv_show('thresh', thresh)
thresh_Contours = thresh.copy()
cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1] # 轮廓检测
warped_Contours = cv2.drawContours(warped_t, cnts, -1, (0, 255, 0), 1) # 在warped_t上绘制cnts轮廓
cv_show('warped_Contours', warped_Contours)
cv2.waitKey(10000)
questionCnts = []
对校正后的图像转化为灰度图,然后进行阈值处理,得到二值图像。在二值图像中再次进行轮廓检测,找到外部轮廓,这些轮廓代表答题卡上的选项。图像如下:

3.筛选和排序选项轮廓
for c in cnts:(x, y, w, h) = cv2.boundingRect(c)ar = w / float(h)if w >= 20 and h >= 20 and ar >= 0.9 and ar <= 1.1:questionCnts.append(c)questionCnts = sort_contours(questionCnts, method='top-to-bottom')[0] # 轮廓将按照它们在图像中从上到下的顺序进行排序。
根据轮廓的宽度、高度和宽高比筛选出类似矩形的轮廓,对选项轮廓进行排序,以便按顺序处理每个问题。
4.判断答案
correct = 0
for (q, i) in enumerate(np.arange(0, len(questionCnts), 5)):cnts = sort_contours(questionCnts[i:i + 5])[0]bubbled = Nonefor (j, c) in enumerate(cnts):mask = np.zeros(thresh.shape, dtype='uint8') # 创建一个与二值图像 thresh 形状相同、数据类型为 uint8 的全零数组作为掩码。cv2.drawContours(mask, [c], -1, 255, -1)cv_show('mask', mask)cv2.waitKey(10000)thresh_mask_and = cv2.bitwise_and(thresh, thresh, mask=mask) # 使用掩码对二值图像 thresh 进行按位与操作,得到只包含当前轮廓内部像素的图像。cv_show('thresh_mask_and', thresh_mask_and)total = cv2.countNonZero(thresh_mask_and) # 计算应用掩码后的图像中非零像素的总数。if bubbled is None or total > bubbled[0]:bubbled = (total, j)# 比较答案,通过将最多零像素总和的轮廓索引与答案索引比较,如果相同,及为绿色,且加入correct中,不同为红color = (0, 0, 255)k = ANSWER_KEY[q]if k == bubbled[1]:color = (0, 255, 0)correct += 1cv2.drawContours(warped_new, [cnts[k]], -1, color, 3)cv_show('warpeding', warped_new)
对上述筛选的轮廓结果进行分组,每5给为一组。创建掩码mask,对二值图像 thresh 进行按位与操作,得到只包含当前轮廓内部像素的图像。计算应用掩码后的图像中非零像素的总数。将选中的选项与正确答案进行比较,如果匹配,则增加正确计数。图像如下:

5.显示结果
score = (correct / 5.0) * 100
print('[INFO] score: {:.2f}% '.format(score))
cv2.putText(warped_new, '{:.2f}%'.format(score), (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2)
cv2.imshow('Original', image)
cv2.imshow('Exam', warped_new)
cv2.waitKey(0)
在校正后的图像上用不同颜色标记出正确和错误的选项并计算并显示得分,显示原始图像和标记后的图像。

三、总结
本次主要为大家展示识别的答题卡的程序,这个程序的关键在于正确地识别答题卡的轮廓、选项的轮廓,以及准确地判断哪个选项被选中。通过这些操作,更好的为大家演示如何正确将轮廓检测、透视变换和阈值处理的结合使用。
相关文章:
OpenCV答题卡识别
文章目录 一、基本流程二、代码实现1.定义函数2.图像预处理(1)高斯模糊、边缘检测(2)轮廓检测(3)透视变换(4)阈值处理和轮廓检测 3.筛选和排序选项轮廓4.判断答案5.显示结果 三、总结…...
通用数据库对象设计
1. 公共属性 这里的数据模型以陈品山的实体-关系模型为基础,增加了两点修改。一是用“组”的概念表达实体间关系,并将组作为一种特殊实体。二是采用继承的思想,将实体的公共属性提取出来,放到统一表中。实体的特有属性保存在单独…...
Java基础12-特殊文件和日志技术
十二、特殊文件和日志技术 1、特殊文件 properties:用来存储键值对数据。 xml:用来存储有关系的数据。 1.1 properties文件 特点:存储键值对,键不能重复,文件后缀一般是.properties结尾的。 properties:是…...
2.4 STM32启动过程
目录 一,启动Flow 1.1 初始化MSP 1.2 初始化PC 1.3 设置堆栈大小 1.4初始化中断向量表 1.5 调用初始化函数(可选) 1.6 调用__main 二,Reset_Handler函数 一,启动Flow 下面是stm32在内部FLASH启动的启动建议流程图,在stm32复位到执行我们程序的main函数的过程中,…...
rm: cannot remove: Device or resource busy 解决方案
大家好,我是爱编程的喵喵。双985硕士毕业,现担任全栈工程师一职,热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的…...
2024年的5款AI写作工具,你用过几个?
AI技术正逐渐渗透到我们生活的方方面面,其中就包括写作领域。今天,我要为大家介绍5款实用的AI写作助手,它们将帮助你提高写作效率,激发创作灵感,让你的写作之路更加顺畅。 1. 宙语Cosmos-全能写作助手 网址ÿ…...
泛癌热门靶点TROP2及研究工具试剂
前 言 TROP2属于肿瘤相关抗原之一,在多种肿瘤中表达升高,促进肿瘤细胞生长、增殖和转移。TROP2已经成为近年来NEJM、肿瘤学期刊、药物研发的多重热点。通过PubMed检索到477篇相关文献,自2020年文献数量逐步增加,2022年达81篇&am…...
2848. 与车相交的点
2848. 与车相交的点 题目链接:2848. 与车相交的点 代码如下: class Solution { public:int numberOfPoints(vector<vector<int>>& nums){set<int> s;for (int i 0; i < nums.size(); i){for (int j nums[i][0]; j < nu…...
第1节 入门
文章目录 1. URL 组成部分详解2. 第一个 Django 项目2.1 项目结构2.2 project 和 app 的关系 3. URL 与视图函数的映射4. URL 的两种传参方式4.1 通过字符串查询4.2 在 path 中携带 5. path 函数详解6. 路由模块化7. 路由反转 1. URL 组成部分详解 URL 的基本组成格式 scheme…...
四数之和(medium)08
其实这道题就是求2数之和,和3数之和的衍生吧,核心算法还是双指针; 暴力解法就不再说了:排序暴力set去重; 直接上:排序双指针去重 大致思路如上图,如果要详细算法过程,可以就看看两数…...
TypeScript中 interface接口 type关键字 enum枚举类型
type interface总是傻傻分不清~~~ Type Aliases (type) type 关键字用于为类型定义一个别名。这可以是基本类型、联合类型、元组、数组、函数等。type 定义的类型在编译后的 JavaScript 代码中会被移除,不会留下任何运行时的代码。 //联合类型 type StringOrNumbe…...
vue3.2实现AES加密解密,秘钥通过API获取,并混淆秘钥,后端thinkphp
aes.ts文件 import CryptoJS from "crypto-js"; import axios from "axios";export const encrypt async(data: any) > {let storeKey sessionStorage.getItem(a)let storeIv:any sessionStorage.getItem(i)// 如果秘钥或 IV 不存在,尝试…...
简述微服务高可用之Sentinel、Seate
简述微服务高可用之Sentinel、Seate使用 下文主要讲述使用sentinel,如何降级限流熔断及如何使用seata管理分布式事务 sentinel服务端安装与使用 1、下载 进入https://github.com/alibaba/Sentinel/releases 根据你的需求进行下载对应版本 我这里是JDK17 下载的1.8.8版本&am…...
将爱传递 将“服务好”延伸
从泰康客户,转身成为泰康人,她直言是因为亲身感受了泰康“服务好”的魅力。 入司已8年的泰康养老浙江分公司HWP何英英,是泰康“服务好”的受益者。她从朋友的理赔中见证了泰康服务好的温度与力量,又被泰康养老的职域模式所吸引选择加入泰康。如今,她全身心投入在服务的第一线,…...
基于MinIO配置bucket,用于文件下载和浏览
文章目录 引言I 配置文件浏览安装MinIO配置自启动服务访问权限配置文件浏览访问地址文件下载地址II 知识扩展MinIO内置访问策略只读策略只写策略读写策略diagnosticsconsoleAdmin引言 需求:文件下载用于OTA升级,文件浏览用于产品展示。 实现方案:基于MinIO配置bucket访问权…...
Ubuntu 配置 ssh 免密连接、安装Docker、docker-compose
Ubuntu 配置 ssh 免密连接 本机 #生成密钥 ssh-keygen -t rsa -b 4096 #发送公钥到服务器 ssh-copy-id usernameremote_host #测试 ssh usernameremote_host全部回车,密钥存储路径默认是 ~/.ssh/id_rsa 服务器 确认服务器公钥配置允许远程公钥认证 sudo vim /et…...
C++ -string -常见用法2
博客主页:【夜泉_ly】 本文专栏:【C】 欢迎点赞👍收藏⭐关注❤️ 文章目录 💡前言💡访问及遍历1.速览2.operator[] -重点⭐2.1函数原型2.2用法2.3与at 3.迭代器3.1函数原型3.2用法速览3.3简介 4.范围for4.1用法速览4.2…...
为您的 WordPress 网站打造完美广告布局 A5广告单元格插件
一个为 WordPress 网站量身定制的强大工具,它将彻底改变您展示广告的方式 灵活多变的布局设计 A5 广告单元格插件的核心优势在于其无与伦比的灵活性。无论您是想要创建整齐的网格布局,还是希望打造独特的不规则设计,这款插件都能满足您的需求。 自定义网格数量:从 2…...
前端的AI工具:ChatGPT Canvas与Claude Artifacts对比 -仅仅是OpenAI一个迟来的追赶吗?- 贺星舰五飞试验成功
如果你对OpenAI的ChatGPT Canvas和Anthropic的Claude Artifacts有所耳闻,可能会想知道这两个工具有何不同,以及哪个能让你的工作流程更加顺畅。这两个工具旨在提升生产力,但侧重点各异——编码、写作、创意和实时反馈。 本文将深入探讨ChatG…...
GNU链接器(LD):输出分区类型(NOLOAD、READONLY、DSECT、COPY、INFO、OVERLAY)介绍
0 参考资料 GNU-LD-v2.30-中文手册.pdf GNU linker.pdf1 前言 一个完整的编译工具链应该包含以下4个部分: (1)编译器 (2)汇编器 (3)链接器 (4)lib库 在GNU工具链中&…...
web vue 项目 Docker化部署
Web 项目 Docker 化部署详细教程 目录 Web 项目 Docker 化部署概述Dockerfile 详解 构建阶段生产阶段 构建和运行 Docker 镜像 1. Web 项目 Docker 化部署概述 Docker 化部署的主要步骤分为以下几个阶段: 构建阶段(Build Stage):…...
大数据学习栈记——Neo4j的安装与使用
本文介绍图数据库Neofj的安装与使用,操作系统:Ubuntu24.04,Neofj版本:2025.04.0。 Apt安装 Neofj可以进行官网安装:Neo4j Deployment Center - Graph Database & Analytics 我这里安装是添加软件源的方法 最新版…...
(十)学生端搭建
本次旨在将之前的已完成的部分功能进行拼装到学生端,同时完善学生端的构建。本次工作主要包括: 1.学生端整体界面布局 2.模拟考场与部分个人画像流程的串联 3.整体学生端逻辑 一、学生端 在主界面可以选择自己的用户角色 选择学生则进入学生登录界面…...
基于距离变化能量开销动态调整的WSN低功耗拓扑控制开销算法matlab仿真
目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.算法仿真参数 5.算法理论概述 6.参考文献 7.完整程序 1.程序功能描述 通过动态调整节点通信的能量开销,平衡网络负载,延长WSN生命周期。具体通过建立基于距离的能量消耗模型&am…...
渲染学进阶内容——模型
最近在写模组的时候发现渲染器里面离不开模型的定义,在渲染的第二篇文章中简单的讲解了一下关于模型部分的内容,其实不管是方块还是方块实体,都离不开模型的内容 🧱 一、CubeListBuilder 功能解析 CubeListBuilder 是 Minecraft Java 版模型系统的核心构建器,用于动态创…...
Qt Http Server模块功能及架构
Qt Http Server 是 Qt 6.0 中引入的一个新模块,它提供了一个轻量级的 HTTP 服务器实现,主要用于构建基于 HTTP 的应用程序和服务。 功能介绍: 主要功能 HTTP服务器功能: 支持 HTTP/1.1 协议 简单的请求/响应处理模型 支持 GET…...
解决本地部署 SmolVLM2 大语言模型运行 flash-attn 报错
出现的问题 安装 flash-attn 会一直卡在 build 那一步或者运行报错 解决办法 是因为你安装的 flash-attn 版本没有对应上,所以报错,到 https://github.com/Dao-AILab/flash-attention/releases 下载对应版本,cu、torch、cp 的版本一定要对…...
使用 SymPy 进行向量和矩阵的高级操作
在科学计算和工程领域,向量和矩阵操作是解决问题的核心技能之一。Python 的 SymPy 库提供了强大的符号计算功能,能够高效地处理向量和矩阵的各种操作。本文将深入探讨如何使用 SymPy 进行向量和矩阵的创建、合并以及维度拓展等操作,并通过具体…...
ABAP设计模式之---“简单设计原则(Simple Design)”
“Simple Design”(简单设计)是软件开发中的一个重要理念,倡导以最简单的方式实现软件功能,以确保代码清晰易懂、易维护,并在项目需求变化时能够快速适应。 其核心目标是避免复杂和过度设计,遵循“让事情保…...
Android第十三次面试总结(四大 组件基础)
Activity生命周期和四大启动模式详解 一、Activity 生命周期 Activity 的生命周期由一系列回调方法组成,用于管理其创建、可见性、焦点和销毁过程。以下是核心方法及其调用时机: onCreate() 调用时机:Activity 首次创建时调用。…...
