《案例》—— OpenCV 实现2B铅笔填涂的答题卡答案识别
文章目录
- 一、案例介绍
- 二、代码解析
一、案例介绍
- 下面是一张使用2B铅笔填涂选项后的答题卡

- 使用OpenCV 中的各种方法进行真确答案识别,最终将正确填涂的答案用绿色圈出,错误的答案不圈出,用红色圈出错误题目的正确答案
- 最终统计正确的题目数量,并在答题卡的左上角写出分数
- 最终的结果图如下:

二、代码解析
-
先直接上完整代码:
import numpy as np import cv2""" 定义显示图片的函数 """def cv_show(name, img):cv2.imshow(name, img)cv2.waitKey(0)""" 寻找透视变换时的四个近似轮廓的顶点 """def order_points(pts):# 一共4个坐标rect = np.zeros((4, 2), dtype="float32")s = pts.sum(axis=1)rect[0] = pts[np.argmin(s)]rect[2] = pts[np.argmax(s)]diff = np.diff(pts, axis=1)rect[1] = pts[np.argmin(diff)]rect[3] = pts[np.argmax(diff)]return rect""" 图像透视变换函数 """def four_point_transform(image, pts):# 获取输入坐标点rect = order_points(pts)(tl, tr, br, bl) = rect# 计算输入的w和h值widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))maxWidth = max(int(widthA), int(widthB))heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))maxHeight = max(int(heightA), int(heightB))# 变换后对应坐标位置dst = np.array([[0, 0], [maxWidth - 1, 0], [maxWidth - 1, maxHeight - 1], [0, maxHeight - 1]], dtype="float32")M = cv2.getPerspectiveTransform(rect, dst)warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight))return warped""" 轮廓排序函数 """def sort_contours(cnts, method='left-to-right'):reverse = Falsei = 0if method == 'right-to-left' or method == 'bottom-to-top':reverse = Trueif method == 'top-to-bottom' or method == 'bottom-to-top':i = 1boundingBoxes = [cv2.boundingRect(c) for c in cnts](cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),key=lambda b: b[1][i], reverse=reverse))# zip(*...)使用星号操作符解包排序后的元组列表,并将其重新组合成两个列表:一个包含所有轮廓,另一个包含所有边界框。return cnts, boundingBoxesANSWER_KEY = {0: 1, 1: 4, 2: 0, 3: 3, 4: 1} # 正确答案""" 图片预处理 """ image = cv2.imread('images/test_01.png') # 读取答题卡图片 contours_img = image.copy() # 复制一个原图为了后续的步骤在其上操作 gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 转换为灰度图 """ 高斯滤波 去除图片中的噪声点 """ blurred = cv2.GaussianBlur(gray, (5, 5), 0) cv_show('blurred', blurred) # 提前定义好的用于显示图片的函数 cv_show """ 边缘检测 """ edged = cv2.Canny(blurred, 75, 200) cv_show('edged', edged) """ 轮廓检测 """ cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1] cv2.drawContours(contours_img, cnts, -1, (0, 0, 255), 3) cv_show('contours_img', contours_img)""" 图像透视变换 --> 将答题卡区域提取出来 """ docCnt = None # 根据轮廓大小进行排序,准备透视变换 cnts = sorted(cnts, key=cv2.contourArea, reverse=True) # 将检测到的答题卡轮廓进行排序,其实只有一个轮廓,为了提高代码的可行性 for c in cnts:peri = cv2.arcLength(c, True) # 计算答题卡区域轮廓的面积approx = cv2.approxPolyDP(c, 0.02 * peri, True) # 轮廓近似if len(approx) == 4:docCnt = approxbreak# 执行透视变换 warped_t = four_point_transform(image, docCnt.reshape(4, 2)) # 提前定义好的图像透视变换函数 four_point_transform warped_new = warped_t.copy() cv_show('warped', warped_t) # 转换为灰度图 warped = cv2.cvtColor(warped_t, cv2.COLOR_BGR2GRAY) # 转换为二值图片,非黑即白 thresh = cv2.threshold(warped, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1] cv_show('thresh', thresh) thresh_Contours = thresh.copy()""" 对答题卡中的每一个答案选项区域进行处理 """# 找到每一个圆圈轮廓 cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1] warped_Contours = cv2.drawContours(warped_t, cnts, -1, (0, 255, 0), 1) cv_show('warped_Contours', warped_Contours)questionCnts = [] # 用于存储正确的答案选项的轮廓 for c in cnts: # 遍历轮廓并计算比例和大小# 计算每个轮廓的外接矩阵的左上角坐标(x, y), 以及宽w高h的大小(x, y, w, h) = cv2.boundingRect(c)ar = w / float(h)# 根据实际情况制定标准if w >= 20 and h >= 20 and ar >= 0.9 and ar <= 1.1:questionCnts.append(c)""" 将每个答案的轮廓按照答题卡上的顺序正确排序后,与正确答案进行比较 """ # 先按照从上到下排序 questionCnts = sort_contours(questionCnts, method="top-to-bottom")[0] # 提前定义好的轮廓排序函数 sort_contourscorrect = 0 # 对每题的五个选项进行循环处理,并与正确答案进行比较 for (q, i) in enumerate(np.arange(0, len(questionCnts), 5)):# 在按照从左到右排序cnts = sort_contours(questionCnts[i:i + 5])[0]bubbled = None# 遍历每一个选项for (j, c) in enumerate(cnts):# 使用mask掩膜来判断结果mask = np.zeros(thresh.shape, dtype="uint8")cv2.drawContours(mask, [c], -1, 255, -1)cv_show('mask', mask)# 通过计算非零点数量来算是否选择这个答案# 利用掩膜(mask)进行”与“操作,只保留mask位置中的内容thresh_mask_and = cv2.bitwise_and(thresh, thresh, mask=mask)cv_show('thresh_mask_and', thresh_mask_and)total = cv2.countNonZero(thresh_mask_and) # 统计像素值不为0的像素数if bubbled is None or total > bubbled[0]: # 通过阈值判断,保存灰度值最大的序号bubbled = (total, j)# 对比正确答案color = (0, 0, 255)k = ANSWER_KEY[q]if k == bubbled[1]: # 判断正确color = (0, 255, 0)correct += 1 # 统计正确的题目# 画出正确答案的轮廓cv2.drawContours(warped_new, [cnts[k]], -1, color, 3)cv_show('warped_new', warped_new)""" 统计得分,并在答题卡的左上角写上分数 """ score = (correct / 5.0) * 100 print("[INFO] score: {}分".format(score)) cv2.putText(warped_new, "{}".format(score), (10, 30),cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2) cv2.imshow("Original", image) cv2.imshow("Exam", warped_new) cv2.waitKey(0) -
步骤解析:
-
首先将每一题的正确答案的索引号与每一题的索引号对应上 ,以一个字典的形式保存在一个变量中
ANSWER_KEY = {0: 1, 1: 4, 2: 0, 3: 3, 4: 1} -
1.图片预处理
- 图像边缘检测的介绍:https://blog.csdn.net/weixin_73504499/article/details/141832066?spm=1001.2014.3001.5501
- 图像轮廓检测的介绍:https://blog.csdn.net/weixin_73504499/article/details/141873522?spm=1001.2014.3001.5501
image = cv2.imread('images/test_01.png') # 读取答题卡图片 contours_img = image.copy() # 复制一个原图为了后续的步骤在其上操作 gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 转换为灰度图 """ 高斯滤波 去除图片中的噪声点 """ blurred = cv2.GaussianBlur(gray, (5, 5), 0) cv_show('blurred', blurred) # 提前定义好的用于显示图片的函数 cv_show """ 边缘检测 """ edged = cv2.Canny(blurred, 75, 200) cv_show('edged', edged) """ 轮廓检测 """ cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1] cv2.drawContours(contours_img, cnts, -1, (0, 0, 255), 3) cv_show('contours_img', contours_img)- 效果如下:

-
2.将答题卡区域提取出来(图像透视变换),并进行处理
- 透视变换的两个关键函数的解析:https://blog.csdn.net/weixin_73504499/article/details/142864082?spm=1001.2014.3001.5501
""" 图像透视变换 --> 将答题卡区域提取出来 """ docCnt = None # 根据轮廓大小进行排序,准备透视变换 cnts = sorted(cnts, key=cv2.contourArea, reverse=True) # 将检测到的答题卡轮廓进行排序,其实只有一个轮廓,为了提高代码的可行性 for c in cnts:peri = cv2.arcLength(c, True) # 计算答题卡区域轮廓的面积approx = cv2.approxPolyDP(c, 0.02 * peri, True) # 轮廓近似if len(approx) == 4:docCnt = approxbreak# 执行透视变换 warped_t = four_point_transform(image, docCnt.reshape(4, 2)) # 提前定义好的图像透视变换函数 four_point_transform warped_new = warped_t.copy() cv_show('warped', warped_t) # 转换为灰度图 warped = cv2.cvtColor(warped_t, cv2.COLOR_BGR2GRAY) # 转换为二值图片,非黑即白 thresh = cv2.threshold(warped, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1] cv_show('thresh', thresh) thresh_Contours = thresh.copy()- 结果如下:

-
3.对答题卡中的每一个答案选项区域进行处理
# 找到每一个圆圈轮廓 cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1] warped_Contours = cv2.drawContours(warped_t, cnts, -1, (0, 255, 0), 1) cv_show('warped_Contours', warped_Contours)questionCnts = [] # 用于存储正确的答案选项的轮廓 for c in cnts: # 遍历轮廓并计算比例和大小# 计算每个轮廓的外接矩阵的左上角坐标(x, y), 以及宽w高h的大小(x, y, w, h) = cv2.boundingRect(c)ar = w / float(h)# 根据实际情况制定标准if w >= 20 and h >= 20 and ar >= 0.9 and ar <= 1.1:questionCnts.append(c)- 结果如下:

- 结果如下:
-
4.将每个答案的轮廓按照答题卡上的顺序正确排序后,与正确答案进行比较
# 先按照从上到下排序 questionCnts = sort_contours(questionCnts, method="top-to-bottom")[0] # 提前定义好的轮廓排序函数 sort_contourscorrect = 0 # 对每题的五个选项进行循环处理,并与正确答案进行比较 for (q, i) in enumerate(np.arange(0, len(questionCnts), 5)):# 在按照从左到右排序cnts = sort_contours(questionCnts[i:i + 5])[0]bubbled = None# 遍历每一个选项for (j, c) in enumerate(cnts):# 使用mask掩膜来判断结果mask = np.zeros(thresh.shape, dtype="uint8")cv2.drawContours(mask, [c], -1, 255, -1)cv_show('mask', mask)# 通过计算非零点数量来算是否选择这个答案# 利用掩膜(mask)进行”与“操作,只保留mask位置中的内容thresh_mask_and = cv2.bitwise_and(thresh, thresh, mask=mask)cv_show('thresh_mask_and', thresh_mask_and)total = cv2.countNonZero(thresh_mask_and) # 统计像素值不为0的像素数if bubbled is None or total > bubbled[0]: # 通过阈值判断,保存灰度值最大的序号bubbled = (total, j)# 对比正确答案color = (0, 0, 255)k = ANSWER_KEY[q]if k == bubbled[1]: # 判断正确color = (0, 255, 0)correct += 1 # 统计正确的题目# 画出正确答案的轮廓cv2.drawContours(warped_new, [cnts[k]], -1, color, 3)cv_show('warped_new', warped_new)- 其中部分展示效果如下:


- 结果如下:

- 其中部分展示效果如下:
-
5.统计得分,并在答题卡的左上角写上分数
""" 统计得分,并在答题卡的左上角写上分数 """ score = (correct / 5.0) * 100 print("[INFO] score: {}分".format(score)) cv2.putText(warped_new, "{}".format(score), (10, 30),cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2) cv2.imshow("Original", image) cv2.imshow("Exam", warped_new) cv2.waitKey(0)- 最终结果如下:

- 最终结果如下:
-
相关文章:
《案例》—— OpenCV 实现2B铅笔填涂的答题卡答案识别
文章目录 一、案例介绍二、代码解析 一、案例介绍 下面是一张使用2B铅笔填涂选项后的答题卡 使用OpenCV 中的各种方法进行真确答案识别,最终将正确填涂的答案用绿色圈出,错误的答案不圈出,用红色圈出错误题目的正确答案最终统计正确的题目数…...
新员工入职流程指南_完整入职流程解析
文章介绍了新员工入职流程的重要性、步骤及持续时间,并推荐ZohoPeople软件自动化管理入职流程,提升新员工入职体验,减少离职率,确保合规性,提升公司品牌形象。 一、新员工入职流程是怎样的? 入职流程是指一…...
mysql查看和修改默认配置
1.查看最大连接数 SELECT max_connections; 或者 SHOW VARIABLES LIKE max_connections;2.查看当前连接的客户端 SHOW PROCESSLIST;2.临时设置最大连接数 SET GLOBAL max_connections 500;3.临时设置连接客户端交互超时时间 SET GLOBAL interactive_timeout 1800;4.永久生…...
海外云手机:出海电商养号智能化方案
随着出海电商的迅猛发展,使用海外云手机进行养号已经成为越来越多商家的新选择。尤其在社交电商推广和短视频引流方面,海外云手机不仅提高了流量的精准度,还助力商家实现业务的快速增长。本文将探讨海外云手机养号相较于传统模式的优势&#…...
OpenAI Canvas用户反馈:并不如外界传言般“炸裂”,更不是“AGI的终极交互形态” | LeetTalk Daily...
“LeetTalk Daily”,每日科技前沿,由LeetTools AI精心筛选,为您带来最新鲜、最具洞察力的科技新闻。 Canvas作为一个独立的界面,通过与ChatGPT的结合来提升用户的协作能力和创作效率。尽管用户对其独立性与现有工具的整合存在不同…...
RiproV9.0主题wordpress主题免扩展可二开PJ版/WordPress博客主题Ripro全解密无后门版本
🔥🎉 全新RiPro9.0开源版发布 —— 探索无限可能🚀🌐 今天,我很高兴能与大家分享一个重磅资源——RiPro9.0开源版!这不是一个普通的版本,而是一个经过精心打磨、全面解密的力作。🔍…...
[LeetCode] 515. 在每个树行中找最大值
题目描述: 给定一棵二叉树的根节点 root ,请找出该二叉树中每一层的最大值。 示例1: 输入: root [1,3,2,5,3,null,9] 输出: [1,3,9]示例2: 输入: root [1,2,3] 输出: [1,3]提示: 二叉树的节点个数的范围是 [0,10…...
【分布式微服务云原生】《微服务架构大揭秘:流行框架与服务治理攻略》
标题:《微服务架构大揭秘:流行框架与服务治理攻略》 摘要:本文深入探讨了流行的微服务架构框架,包括 Spring Cloud、Docker Kubernetes、Dubbo、Service Mesh 和 Serverless 架构,详细介绍了它们的关键组件和服务治理…...
uniapp uni.uploadFile errMsg: “uploadFile:fail
uniapp 上传后一直显示加载中 1.检查前后端上传有无问题 2.检查失败信息 await uni.uploadFile({url,filePath,name,formData,header,timeout: 30000000, // 自定义上传超时时间fail: async function(err) {$util.hideAll()// 失败// err 返回 {errMsg: "uploadFile:fai…...
一个常见问题:TCP和UDP是否可以使用一个端口
TCP(传输控制协议)和UDP(用户数据报协议)做为两种被广泛使用的协议,它们在处理数据时采用不同的机制,那么有一个问题,在同一系统内,TCP和UDP的服务是否可以使用同一个端口呢…...
前端报错:‘vue-cli-service‘ 不是内部或外部命令,也不是可运行的程序(node_modules下载不下来)
原因:Vue CLI 没有被正确安装,或者其安装路径没有被添加到你的系统环境变量中。 一、确认 Vue CLI 是否已安装: 打开命令行工具(例如 CMD、PowerShell、Terminal),输入以下命令来检查 Vue CLI 是否已安装…...
白日门【鬼服无限刀】win服务端+安卓客户端+教程+GM后台
演示系统:Windows Server 2012 -------------------------------------------------------------------------------------------------------------------------- 把服务端上传解压缩到服务器D盘根目录:D:\【解压完成后检查路径是否正确:D:\】 安装基础运行环境&…...
如何迅速的了解一个人
目录 社会经济背景 生活满意度 爱心和同情心 如果你想迅速地了解一个人,问他问题是最快捷的方法。不论你是相亲、工作、而试、看医生还是为孩子找个学校,事先设计好你想提出的问题,想好你究竟要搜罗对方哪一方面的信息这样做会实现许多目…...
Window和Linux远程调度kettle
在windows和linux分别安装kettle,我的是pdi-ce-8.2.0.0-342版本,在windows中配置好之后,直接放到虚拟机的目录下 在cmd窗口中到kettle根目录下执行 (carte ip 端口 ),出现如下提示即启动成功 在远程端…...
设定义结构变量
在C语言中,可以使用struct关键字来定义结构变量。结构变量是由多个不同类型的成员变量组成的数据类型,可以在一个变量中存储多个相关的数据。 定义结构变量的语法如下: struct 结构名 {数据类型 成员1;数据类型 成员2;... };例如࿰…...
SSD |(七)FTL详解(中)
文章目录 📚垃圾回收🐇垃圾回收原理🐇写放大🐇垃圾回收实现🐇垃圾回收时机 📚解除映射关系📚磨损均衡 📚垃圾回收 🐇垃圾回收原理 ✋设定一个迷你SSD空间: 假…...
Swift 协议:深入解析与高级应用
Swift 协议:深入解析与高级应用 Swift 协议是 Swift 编程语言中的一项核心特性,它提供了一种定义接口和实现多态的强大方式。本文将深入探讨 Swift 协议的概念、用法和高级应用,帮助读者更好地理解和运用这一特性。 什么是 Swift 协议&…...
API项目3:API签名认证
问题引入 我们为开发者提供了接口,却对调用者一无所知 假设我们的服务器只能允许 100 个人同时调用接口。如果有攻击者疯狂地请求这个接口,那是很危险的。一方面这可能会损害安全性,另一方面耗尽服务器性能,影响正常用户的使用。…...
unity学习-Directional light光的设置
ccColor:环境光的颜色 Mode:灯光模式,Realtime(实时光影),实时计算光影,消耗性能但是效果好,Baked烘焙光影,将光的照射效果作为贴图贴在静态的物体上形成一种虚假的光照…...
简单实现通过电脑操作手机
通过电脑操作手机,支持单击,拖抓事件,延时有1-2秒。 具体步骤: 1、从手机截图到sdcard 2、将图片导出到PC 3、从PC加载展示图片 4、开启定时器 5、设置点击、滚动事件 1、 private static void takeScreenshot(String path)…...
手游刚开服就被攻击怎么办?如何防御DDoS?
开服初期是手游最脆弱的阶段,极易成为DDoS攻击的目标。一旦遭遇攻击,可能导致服务器瘫痪、玩家流失,甚至造成巨大经济损失。本文为开发者提供一套简洁有效的应急与防御方案,帮助快速应对并构建长期防护体系。 一、遭遇攻击的紧急应…...
synchronized 学习
学习源: https://www.bilibili.com/video/BV1aJ411V763?spm_id_from333.788.videopod.episodes&vd_source32e1c41a9370911ab06d12fbc36c4ebc 1.应用场景 不超卖,也要考虑性能问题(场景) 2.常见面试问题: sync出…...
css实现圆环展示百分比,根据值动态展示所占比例
代码如下 <view class""><view class"circle-chart"><view v-if"!!num" class"pie-item" :style"{background: conic-gradient(var(--one-color) 0%,#E9E6F1 ${num}%),}"></view><view v-else …...
以下是对华为 HarmonyOS NETX 5属性动画(ArkTS)文档的结构化整理,通过层级标题、表格和代码块提升可读性:
一、属性动画概述NETX 作用:实现组件通用属性的渐变过渡效果,提升用户体验。支持属性:width、height、backgroundColor、opacity、scale、rotate、translate等。注意事项: 布局类属性(如宽高)变化时&#…...
【项目实战】通过多模态+LangGraph实现PPT生成助手
PPT自动生成系统 基于LangGraph的PPT自动生成系统,可以将Markdown文档自动转换为PPT演示文稿。 功能特点 Markdown解析:自动解析Markdown文档结构PPT模板分析:分析PPT模板的布局和风格智能布局决策:匹配内容与合适的PPT布局自动…...
如何为服务器生成TLS证书
TLS(Transport Layer Security)证书是确保网络通信安全的重要手段,它通过加密技术保护传输的数据不被窃听和篡改。在服务器上配置TLS证书,可以使用户通过HTTPS协议安全地访问您的网站。本文将详细介绍如何在服务器上生成一个TLS证…...
使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台
🎯 使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台 📌 项目背景 随着大语言模型(LLM)的广泛应用,开发者常面临多个挑战: 各大模型(OpenAI、Claude、Gemini、Ollama)接口风格不统一;缺乏一个统一平台进行模型调用与测试;本地模型 Ollama 的集成与前…...
Angular微前端架构:Module Federation + ngx-build-plus (Webpack)
以下是一个完整的 Angular 微前端示例,其中使用的是 Module Federation 和 npx-build-plus 实现了主应用(Shell)与子应用(Remote)的集成。 🛠️ 项目结构 angular-mf/ ├── shell-app/ # 主应用&…...
HashMap中的put方法执行流程(流程图)
1 put操作整体流程 HashMap 的 put 操作是其最核心的功能之一。在 JDK 1.8 及以后版本中,其主要逻辑封装在 putVal 这个内部方法中。整个过程大致如下: 初始判断与哈希计算: 首先,putVal 方法会检查当前的 table(也就…...
Unity中的transform.up
2025年6月8日,周日下午 在Unity中,transform.up是Transform组件的一个属性,表示游戏对象在世界空间中的“上”方向(Y轴正方向),且会随对象旋转动态变化。以下是关键点解析: 基本定义 transfor…...
