《案例》—— OpenCV 实现2B铅笔填涂的答题卡答案识别
文章目录
- 一、案例介绍
- 二、代码解析
一、案例介绍
- 下面是一张使用2B铅笔填涂选项后的答题卡
- 使用OpenCV 中的各种方法进行真确答案识别,最终将正确填涂的答案用绿色圈出,错误的答案不圈出,用红色圈出错误题目的正确答案
- 最终统计正确的题目数量,并在答题卡的左上角写出分数
- 最终的结果图如下:
二、代码解析
-
先直接上完整代码:
import numpy as np import cv2""" 定义显示图片的函数 """def cv_show(name, img):cv2.imshow(name, img)cv2.waitKey(0)""" 寻找透视变换时的四个近似轮廓的顶点 """def order_points(pts):# 一共4个坐标rect = np.zeros((4, 2), dtype="float32")s = pts.sum(axis=1)rect[0] = pts[np.argmin(s)]rect[2] = pts[np.argmax(s)]diff = np.diff(pts, axis=1)rect[1] = pts[np.argmin(diff)]rect[3] = pts[np.argmax(diff)]return rect""" 图像透视变换函数 """def four_point_transform(image, pts):# 获取输入坐标点rect = order_points(pts)(tl, tr, br, bl) = rect# 计算输入的w和h值widthA = np.sqrt(((br[0] - bl[0]) ** 2) + ((br[1] - bl[1]) ** 2))widthB = np.sqrt(((tr[0] - tl[0]) ** 2) + ((tr[1] - tl[1]) ** 2))maxWidth = max(int(widthA), int(widthB))heightA = np.sqrt(((tr[0] - br[0]) ** 2) + ((tr[1] - br[1]) ** 2))heightB = np.sqrt(((tl[0] - bl[0]) ** 2) + ((tl[1] - bl[1]) ** 2))maxHeight = max(int(heightA), int(heightB))# 变换后对应坐标位置dst = np.array([[0, 0], [maxWidth - 1, 0], [maxWidth - 1, maxHeight - 1], [0, maxHeight - 1]], dtype="float32")M = cv2.getPerspectiveTransform(rect, dst)warped = cv2.warpPerspective(image, M, (maxWidth, maxHeight))return warped""" 轮廓排序函数 """def sort_contours(cnts, method='left-to-right'):reverse = Falsei = 0if method == 'right-to-left' or method == 'bottom-to-top':reverse = Trueif method == 'top-to-bottom' or method == 'bottom-to-top':i = 1boundingBoxes = [cv2.boundingRect(c) for c in cnts](cnts, boundingBoxes) = zip(*sorted(zip(cnts, boundingBoxes),key=lambda b: b[1][i], reverse=reverse))# zip(*...)使用星号操作符解包排序后的元组列表,并将其重新组合成两个列表:一个包含所有轮廓,另一个包含所有边界框。return cnts, boundingBoxesANSWER_KEY = {0: 1, 1: 4, 2: 0, 3: 3, 4: 1} # 正确答案""" 图片预处理 """ image = cv2.imread('images/test_01.png') # 读取答题卡图片 contours_img = image.copy() # 复制一个原图为了后续的步骤在其上操作 gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 转换为灰度图 """ 高斯滤波 去除图片中的噪声点 """ blurred = cv2.GaussianBlur(gray, (5, 5), 0) cv_show('blurred', blurred) # 提前定义好的用于显示图片的函数 cv_show """ 边缘检测 """ edged = cv2.Canny(blurred, 75, 200) cv_show('edged', edged) """ 轮廓检测 """ cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1] cv2.drawContours(contours_img, cnts, -1, (0, 0, 255), 3) cv_show('contours_img', contours_img)""" 图像透视变换 --> 将答题卡区域提取出来 """ docCnt = None # 根据轮廓大小进行排序,准备透视变换 cnts = sorted(cnts, key=cv2.contourArea, reverse=True) # 将检测到的答题卡轮廓进行排序,其实只有一个轮廓,为了提高代码的可行性 for c in cnts:peri = cv2.arcLength(c, True) # 计算答题卡区域轮廓的面积approx = cv2.approxPolyDP(c, 0.02 * peri, True) # 轮廓近似if len(approx) == 4:docCnt = approxbreak# 执行透视变换 warped_t = four_point_transform(image, docCnt.reshape(4, 2)) # 提前定义好的图像透视变换函数 four_point_transform warped_new = warped_t.copy() cv_show('warped', warped_t) # 转换为灰度图 warped = cv2.cvtColor(warped_t, cv2.COLOR_BGR2GRAY) # 转换为二值图片,非黑即白 thresh = cv2.threshold(warped, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1] cv_show('thresh', thresh) thresh_Contours = thresh.copy()""" 对答题卡中的每一个答案选项区域进行处理 """# 找到每一个圆圈轮廓 cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1] warped_Contours = cv2.drawContours(warped_t, cnts, -1, (0, 255, 0), 1) cv_show('warped_Contours', warped_Contours)questionCnts = [] # 用于存储正确的答案选项的轮廓 for c in cnts: # 遍历轮廓并计算比例和大小# 计算每个轮廓的外接矩阵的左上角坐标(x, y), 以及宽w高h的大小(x, y, w, h) = cv2.boundingRect(c)ar = w / float(h)# 根据实际情况制定标准if w >= 20 and h >= 20 and ar >= 0.9 and ar <= 1.1:questionCnts.append(c)""" 将每个答案的轮廓按照答题卡上的顺序正确排序后,与正确答案进行比较 """ # 先按照从上到下排序 questionCnts = sort_contours(questionCnts, method="top-to-bottom")[0] # 提前定义好的轮廓排序函数 sort_contourscorrect = 0 # 对每题的五个选项进行循环处理,并与正确答案进行比较 for (q, i) in enumerate(np.arange(0, len(questionCnts), 5)):# 在按照从左到右排序cnts = sort_contours(questionCnts[i:i + 5])[0]bubbled = None# 遍历每一个选项for (j, c) in enumerate(cnts):# 使用mask掩膜来判断结果mask = np.zeros(thresh.shape, dtype="uint8")cv2.drawContours(mask, [c], -1, 255, -1)cv_show('mask', mask)# 通过计算非零点数量来算是否选择这个答案# 利用掩膜(mask)进行”与“操作,只保留mask位置中的内容thresh_mask_and = cv2.bitwise_and(thresh, thresh, mask=mask)cv_show('thresh_mask_and', thresh_mask_and)total = cv2.countNonZero(thresh_mask_and) # 统计像素值不为0的像素数if bubbled is None or total > bubbled[0]: # 通过阈值判断,保存灰度值最大的序号bubbled = (total, j)# 对比正确答案color = (0, 0, 255)k = ANSWER_KEY[q]if k == bubbled[1]: # 判断正确color = (0, 255, 0)correct += 1 # 统计正确的题目# 画出正确答案的轮廓cv2.drawContours(warped_new, [cnts[k]], -1, color, 3)cv_show('warped_new', warped_new)""" 统计得分,并在答题卡的左上角写上分数 """ score = (correct / 5.0) * 100 print("[INFO] score: {}分".format(score)) cv2.putText(warped_new, "{}".format(score), (10, 30),cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2) cv2.imshow("Original", image) cv2.imshow("Exam", warped_new) cv2.waitKey(0)
-
步骤解析:
-
首先将每一题的正确答案的索引号与每一题的索引号对应上 ,以一个字典的形式保存在一个变量中
ANSWER_KEY = {0: 1, 1: 4, 2: 0, 3: 3, 4: 1}
-
1.图片预处理
- 图像边缘检测的介绍:https://blog.csdn.net/weixin_73504499/article/details/141832066?spm=1001.2014.3001.5501
- 图像轮廓检测的介绍:https://blog.csdn.net/weixin_73504499/article/details/141873522?spm=1001.2014.3001.5501
image = cv2.imread('images/test_01.png') # 读取答题卡图片 contours_img = image.copy() # 复制一个原图为了后续的步骤在其上操作 gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) # 转换为灰度图 """ 高斯滤波 去除图片中的噪声点 """ blurred = cv2.GaussianBlur(gray, (5, 5), 0) cv_show('blurred', blurred) # 提前定义好的用于显示图片的函数 cv_show """ 边缘检测 """ edged = cv2.Canny(blurred, 75, 200) cv_show('edged', edged) """ 轮廓检测 """ cnts = cv2.findContours(edged.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1] cv2.drawContours(contours_img, cnts, -1, (0, 0, 255), 3) cv_show('contours_img', contours_img)
- 效果如下:
-
2.将答题卡区域提取出来(图像透视变换),并进行处理
- 透视变换的两个关键函数的解析:https://blog.csdn.net/weixin_73504499/article/details/142864082?spm=1001.2014.3001.5501
""" 图像透视变换 --> 将答题卡区域提取出来 """ docCnt = None # 根据轮廓大小进行排序,准备透视变换 cnts = sorted(cnts, key=cv2.contourArea, reverse=True) # 将检测到的答题卡轮廓进行排序,其实只有一个轮廓,为了提高代码的可行性 for c in cnts:peri = cv2.arcLength(c, True) # 计算答题卡区域轮廓的面积approx = cv2.approxPolyDP(c, 0.02 * peri, True) # 轮廓近似if len(approx) == 4:docCnt = approxbreak# 执行透视变换 warped_t = four_point_transform(image, docCnt.reshape(4, 2)) # 提前定义好的图像透视变换函数 four_point_transform warped_new = warped_t.copy() cv_show('warped', warped_t) # 转换为灰度图 warped = cv2.cvtColor(warped_t, cv2.COLOR_BGR2GRAY) # 转换为二值图片,非黑即白 thresh = cv2.threshold(warped, 0, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU)[1] cv_show('thresh', thresh) thresh_Contours = thresh.copy()
- 结果如下:
-
3.对答题卡中的每一个答案选项区域进行处理
# 找到每一个圆圈轮廓 cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[1] warped_Contours = cv2.drawContours(warped_t, cnts, -1, (0, 255, 0), 1) cv_show('warped_Contours', warped_Contours)questionCnts = [] # 用于存储正确的答案选项的轮廓 for c in cnts: # 遍历轮廓并计算比例和大小# 计算每个轮廓的外接矩阵的左上角坐标(x, y), 以及宽w高h的大小(x, y, w, h) = cv2.boundingRect(c)ar = w / float(h)# 根据实际情况制定标准if w >= 20 and h >= 20 and ar >= 0.9 and ar <= 1.1:questionCnts.append(c)
- 结果如下:
- 结果如下:
-
4.将每个答案的轮廓按照答题卡上的顺序正确排序后,与正确答案进行比较
# 先按照从上到下排序 questionCnts = sort_contours(questionCnts, method="top-to-bottom")[0] # 提前定义好的轮廓排序函数 sort_contourscorrect = 0 # 对每题的五个选项进行循环处理,并与正确答案进行比较 for (q, i) in enumerate(np.arange(0, len(questionCnts), 5)):# 在按照从左到右排序cnts = sort_contours(questionCnts[i:i + 5])[0]bubbled = None# 遍历每一个选项for (j, c) in enumerate(cnts):# 使用mask掩膜来判断结果mask = np.zeros(thresh.shape, dtype="uint8")cv2.drawContours(mask, [c], -1, 255, -1)cv_show('mask', mask)# 通过计算非零点数量来算是否选择这个答案# 利用掩膜(mask)进行”与“操作,只保留mask位置中的内容thresh_mask_and = cv2.bitwise_and(thresh, thresh, mask=mask)cv_show('thresh_mask_and', thresh_mask_and)total = cv2.countNonZero(thresh_mask_and) # 统计像素值不为0的像素数if bubbled is None or total > bubbled[0]: # 通过阈值判断,保存灰度值最大的序号bubbled = (total, j)# 对比正确答案color = (0, 0, 255)k = ANSWER_KEY[q]if k == bubbled[1]: # 判断正确color = (0, 255, 0)correct += 1 # 统计正确的题目# 画出正确答案的轮廓cv2.drawContours(warped_new, [cnts[k]], -1, color, 3)cv_show('warped_new', warped_new)
- 其中部分展示效果如下:
- 结果如下:
- 其中部分展示效果如下:
-
5.统计得分,并在答题卡的左上角写上分数
""" 统计得分,并在答题卡的左上角写上分数 """ score = (correct / 5.0) * 100 print("[INFO] score: {}分".format(score)) cv2.putText(warped_new, "{}".format(score), (10, 30),cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2) cv2.imshow("Original", image) cv2.imshow("Exam", warped_new) cv2.waitKey(0)
- 最终结果如下:
- 最终结果如下:
-
相关文章:

《案例》—— OpenCV 实现2B铅笔填涂的答题卡答案识别
文章目录 一、案例介绍二、代码解析 一、案例介绍 下面是一张使用2B铅笔填涂选项后的答题卡 使用OpenCV 中的各种方法进行真确答案识别,最终将正确填涂的答案用绿色圈出,错误的答案不圈出,用红色圈出错误题目的正确答案最终统计正确的题目数…...

新员工入职流程指南_完整入职流程解析
文章介绍了新员工入职流程的重要性、步骤及持续时间,并推荐ZohoPeople软件自动化管理入职流程,提升新员工入职体验,减少离职率,确保合规性,提升公司品牌形象。 一、新员工入职流程是怎样的? 入职流程是指一…...

mysql查看和修改默认配置
1.查看最大连接数 SELECT max_connections; 或者 SHOW VARIABLES LIKE max_connections;2.查看当前连接的客户端 SHOW PROCESSLIST;2.临时设置最大连接数 SET GLOBAL max_connections 500;3.临时设置连接客户端交互超时时间 SET GLOBAL interactive_timeout 1800;4.永久生…...

海外云手机:出海电商养号智能化方案
随着出海电商的迅猛发展,使用海外云手机进行养号已经成为越来越多商家的新选择。尤其在社交电商推广和短视频引流方面,海外云手机不仅提高了流量的精准度,还助力商家实现业务的快速增长。本文将探讨海外云手机养号相较于传统模式的优势&#…...

OpenAI Canvas用户反馈:并不如外界传言般“炸裂”,更不是“AGI的终极交互形态” | LeetTalk Daily...
“LeetTalk Daily”,每日科技前沿,由LeetTools AI精心筛选,为您带来最新鲜、最具洞察力的科技新闻。 Canvas作为一个独立的界面,通过与ChatGPT的结合来提升用户的协作能力和创作效率。尽管用户对其独立性与现有工具的整合存在不同…...

RiproV9.0主题wordpress主题免扩展可二开PJ版/WordPress博客主题Ripro全解密无后门版本
🔥🎉 全新RiPro9.0开源版发布 —— 探索无限可能🚀🌐 今天,我很高兴能与大家分享一个重磅资源——RiPro9.0开源版!这不是一个普通的版本,而是一个经过精心打磨、全面解密的力作。🔍…...

[LeetCode] 515. 在每个树行中找最大值
题目描述: 给定一棵二叉树的根节点 root ,请找出该二叉树中每一层的最大值。 示例1: 输入: root [1,3,2,5,3,null,9] 输出: [1,3,9]示例2: 输入: root [1,2,3] 输出: [1,3]提示: 二叉树的节点个数的范围是 [0,10…...
【分布式微服务云原生】《微服务架构大揭秘:流行框架与服务治理攻略》
标题:《微服务架构大揭秘:流行框架与服务治理攻略》 摘要:本文深入探讨了流行的微服务架构框架,包括 Spring Cloud、Docker Kubernetes、Dubbo、Service Mesh 和 Serverless 架构,详细介绍了它们的关键组件和服务治理…...

uniapp uni.uploadFile errMsg: “uploadFile:fail
uniapp 上传后一直显示加载中 1.检查前后端上传有无问题 2.检查失败信息 await uni.uploadFile({url,filePath,name,formData,header,timeout: 30000000, // 自定义上传超时时间fail: async function(err) {$util.hideAll()// 失败// err 返回 {errMsg: "uploadFile:fai…...
一个常见问题:TCP和UDP是否可以使用一个端口
TCP(传输控制协议)和UDP(用户数据报协议)做为两种被广泛使用的协议,它们在处理数据时采用不同的机制,那么有一个问题,在同一系统内,TCP和UDP的服务是否可以使用同一个端口呢…...
前端报错:‘vue-cli-service‘ 不是内部或外部命令,也不是可运行的程序(node_modules下载不下来)
原因:Vue CLI 没有被正确安装,或者其安装路径没有被添加到你的系统环境变量中。 一、确认 Vue CLI 是否已安装: 打开命令行工具(例如 CMD、PowerShell、Terminal),输入以下命令来检查 Vue CLI 是否已安装…...

白日门【鬼服无限刀】win服务端+安卓客户端+教程+GM后台
演示系统:Windows Server 2012 -------------------------------------------------------------------------------------------------------------------------- 把服务端上传解压缩到服务器D盘根目录:D:\【解压完成后检查路径是否正确:D:\】 安装基础运行环境&…...
如何迅速的了解一个人
目录 社会经济背景 生活满意度 爱心和同情心 如果你想迅速地了解一个人,问他问题是最快捷的方法。不论你是相亲、工作、而试、看医生还是为孩子找个学校,事先设计好你想提出的问题,想好你究竟要搜罗对方哪一方面的信息这样做会实现许多目…...

Window和Linux远程调度kettle
在windows和linux分别安装kettle,我的是pdi-ce-8.2.0.0-342版本,在windows中配置好之后,直接放到虚拟机的目录下 在cmd窗口中到kettle根目录下执行 (carte ip 端口 ),出现如下提示即启动成功 在远程端…...
设定义结构变量
在C语言中,可以使用struct关键字来定义结构变量。结构变量是由多个不同类型的成员变量组成的数据类型,可以在一个变量中存储多个相关的数据。 定义结构变量的语法如下: struct 结构名 {数据类型 成员1;数据类型 成员2;... };例如࿰…...

SSD |(七)FTL详解(中)
文章目录 📚垃圾回收🐇垃圾回收原理🐇写放大🐇垃圾回收实现🐇垃圾回收时机 📚解除映射关系📚磨损均衡 📚垃圾回收 🐇垃圾回收原理 ✋设定一个迷你SSD空间: 假…...
Swift 协议:深入解析与高级应用
Swift 协议:深入解析与高级应用 Swift 协议是 Swift 编程语言中的一项核心特性,它提供了一种定义接口和实现多态的强大方式。本文将深入探讨 Swift 协议的概念、用法和高级应用,帮助读者更好地理解和运用这一特性。 什么是 Swift 协议&…...

API项目3:API签名认证
问题引入 我们为开发者提供了接口,却对调用者一无所知 假设我们的服务器只能允许 100 个人同时调用接口。如果有攻击者疯狂地请求这个接口,那是很危险的。一方面这可能会损害安全性,另一方面耗尽服务器性能,影响正常用户的使用。…...
unity学习-Directional light光的设置
ccColor:环境光的颜色 Mode:灯光模式,Realtime(实时光影),实时计算光影,消耗性能但是效果好,Baked烘焙光影,将光的照射效果作为贴图贴在静态的物体上形成一种虚假的光照…...
简单实现通过电脑操作手机
通过电脑操作手机,支持单击,拖抓事件,延时有1-2秒。 具体步骤: 1、从手机截图到sdcard 2、将图片导出到PC 3、从PC加载展示图片 4、开启定时器 5、设置点击、滚动事件 1、 private static void takeScreenshot(String path)…...

【HarmonyOS 5.0】DevEco Testing:鸿蒙应用质量保障的终极武器
——全方位测试解决方案与代码实战 一、工具定位与核心能力 DevEco Testing是HarmonyOS官方推出的一体化测试平台,覆盖应用全生命周期测试需求,主要提供五大核心能力: 测试类型检测目标关键指标功能体验基…...

使用分级同态加密防御梯度泄漏
抽象 联邦学习 (FL) 支持跨分布式客户端进行协作模型训练,而无需共享原始数据,这使其成为在互联和自动驾驶汽车 (CAV) 等领域保护隐私的机器学习的一种很有前途的方法。然而,最近的研究表明&…...

dedecms 织梦自定义表单留言增加ajax验证码功能
增加ajax功能模块,用户不点击提交按钮,只要输入框失去焦点,就会提前提示验证码是否正确。 一,模板上增加验证码 <input name"vdcode"id"vdcode" placeholder"请输入验证码" type"text&quo…...

IoT/HCIP实验-3/LiteOS操作系统内核实验(任务、内存、信号量、CMSIS..)
文章目录 概述HelloWorld 工程C/C配置编译器主配置Makefile脚本烧录器主配置运行结果程序调用栈 任务管理实验实验结果osal 系统适配层osal_task_create 其他实验实验源码内存管理实验互斥锁实验信号量实验 CMISIS接口实验还是得JlINKCMSIS 简介LiteOS->CMSIS任务间消息交互…...
在鸿蒙HarmonyOS 5中使用DevEco Studio实现录音机应用
1. 项目配置与权限设置 1.1 配置module.json5 {"module": {"requestPermissions": [{"name": "ohos.permission.MICROPHONE","reason": "录音需要麦克风权限"},{"name": "ohos.permission.WRITE…...
浅谈不同二分算法的查找情况
二分算法原理比较简单,但是实际的算法模板却有很多,这一切都源于二分查找问题中的复杂情况和二分算法的边界处理,以下是博主对一些二分算法查找的情况分析。 需要说明的是,以下二分算法都是基于有序序列为升序有序的情况…...
Redis的发布订阅模式与专业的 MQ(如 Kafka, RabbitMQ)相比,优缺点是什么?适用于哪些场景?
Redis 的发布订阅(Pub/Sub)模式与专业的 MQ(Message Queue)如 Kafka、RabbitMQ 进行比较,核心的权衡点在于:简单与速度 vs. 可靠与功能。 下面我们详细展开对比。 Redis Pub/Sub 的核心特点 它是一个发后…...

JVM虚拟机:内存结构、垃圾回收、性能优化
1、JVM虚拟机的简介 Java 虚拟机(Java Virtual Machine 简称:JVM)是运行所有 Java 程序的抽象计算机,是 Java 语言的运行环境,实现了 Java 程序的跨平台特性。JVM 屏蔽了与具体操作系统平台相关的信息,使得 Java 程序只需生成在 JVM 上运行的目标代码(字节码),就可以…...

【JVM】Java虚拟机(二)——垃圾回收
目录 一、如何判断对象可以回收 (一)引用计数法 (二)可达性分析算法 二、垃圾回收算法 (一)标记清除 (二)标记整理 (三)复制 (四ÿ…...
Git常用命令完全指南:从入门到精通
Git常用命令完全指南:从入门到精通 一、基础配置命令 1. 用户信息配置 # 设置全局用户名 git config --global user.name "你的名字"# 设置全局邮箱 git config --global user.email "你的邮箱example.com"# 查看所有配置 git config --list…...