当前位置：首页 > news >正文

竞赛基于深度学习的人脸专注度检测计算系统 - opencv python cnn

news 2026/5/11 10:49:40

文章目录

1 前言
2 相关技术
- 2.1CNN简介
- 2.2 人脸识别算法
- 2.3专注检测原理
- 2.4 OpenCV
3 功能介绍
- 3.1人脸录入功能
- 3.2 人脸识别
- 3.3 人脸专注度检测
- 3.4 识别记录
4 最后

1 前言

🔥 优质竞赛项目系列，今天要分享的是

🚩 基于深度学习的人脸专注度检测计算算法

该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！

🥇学长这里给一个题目综合评分(每项满分5分)

难度系数：3分
工作量：3分
创新点：5分

🧿 更多资料, 项目分享：

https://gitee.com/dancheng-senior/postgraduate

2 相关技术

2.1CNN简介

卷积神经网络(CNN)，是由多层卷积结构组成的一种神经网络。卷积结构可以减少网络的内存占用、参数和模型的过拟合。卷积神经网络是一种典型的深度学习算法。广泛应用于视觉处理和人工智能领域，特别是在图像识别和人脸识别领域。与完全连接的神经网络相比，CNN输入是通过交换参数和局部感知来提取图像特征的图像。卷积神经网络是由输入层、卷积层、池化层、全连接层和输出层五层结构组成。其具体模型如下图所示。
在这里插入图片描述

(1)输入层(Input
layer)：输入层就是神经网络的输入端口，就是把输入传入的入口。通常传入的图像的R，G，B三个通道的数据。数据的输入一般是多维的矩阵向量，其中矩阵中的数值代表的是图像对应位置的像素点的值。

(2)卷积层(Convolution layer)：卷积层在CNN中主要具有学习功能，它主要提取输入的数据的特征值。

(3)池化层(Pooling
layer)：池化层通过对卷积层的特征值进行压缩来获得自己的特征值，减小特征值的矩阵的维度，减小网络计算量，加速收敛速度可以有效避免过拟合问题。

(4)全连接层(Full connected
layer)：全连接层主要实现是把经过卷积层和池化层处理的数据进行集合在一起，形成一个或者多个的全连接层，该层在CNN的功能主要是实现高阶推理计算。

(5)输出层(Output layer)：输出层在全连接层之后，是整个神经网络的输出端口即把处理分析后的数据进行输出。

2.2 人脸识别算法

利用dlib实现人脸68个关键点检测并标注，关键代码

import cv2# 加载人脸识别模型face_rec_model_path = 'dlib_face_recognition_resnet_model_v1.dat'facerec = dlib.face_recognition_model_v1(face_rec_model_path)# 加载特征点识别模型predictor_path = "shape_predictor_5_face_landmarks.dat"predictor = dlib.shape_predictor(predictor_path)# 读取图片img_path = "step1/image/face.jpg"img = cv2.imread(img_path)# 转换为灰阶图片gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 正向人脸检测器将图像detector = dlib.get_frontal_face_detector()# 使用人脸识别模型来检测图像中的人脸faces = detector(gray, 1)# 使用特征点识别模型来检测人脸中的特征for i, face in enumerate(faces):# 获取人脸特征点shape = predictor(img, face)

2.3专注检测原理

总体流程

主要通过电脑摄像头去实时的抓拍学生当前的状态和行为，不间断的采集学生上课时的面部表情和眼睛注视的方向，利用CNN提取相应的特征数据并进行分析处理，若对应输出的判断值大于设置的阈值时，则认为学生在走神没有认真学习。并且对拍摄时间进行计时，在界面上实时输出该学生在课堂上的有效学习时间和学生在课堂上专注时间的比例并进行存入表格中。

在这里插入图片描述

眼睛检测算法

基于dlib人脸识别68特征点检测、分别获取左右眼面部标志的索引，通过opencv对视频流进行灰度化处理，检测出人眼的位置信息。人脸特征点检测用到了dlib，dlib有两个关键函数：dlib.get_frontal_face_detector()和dlib.shape_predictor(predictor_path)。

前者是内置的人脸检测算法，使用HOG pyramid，检测人脸区域的界限（bounds）。
后者是用来检测一个区域内的特征点，并输出这些特征点的坐标，它需要一个预先训练好的模型（通过文件路径的方法传入），才能正常工作。
使用开源模型shape_predictor_68_face_landmarks.dat，可以得到68个特征点位置的坐标，连起来后，可以有如图所示的效果（红色是HOG
pyramid检测的结果，绿色是shape_predictor的结果，仅把同一个器官的特征点连线）。

在这里插入图片描述

通过计算眼睛的宽高比来确定专注状态

基本原理：计算眼睛长宽比 Eye Aspect Ratio，EAR.当人眼睁开时，EAR在某个值上下波动，当人眼闭合时
在这里插入图片描述

关键代码

 # -*- coding: utf-8 -*-# import the necessary packagesfrom scipy.spatial import distance as distfrom imutils.video import FileVideoStreamfrom imutils.video import VideoStreamfrom imutils import face_utilsimport numpy as np # 数据处理的库 numpyimport argparseimport imutilsimport timeimport dlibimport cv2def eye_aspect_ratio(eye):# 垂直眼标志（X，Y）坐标A = dist.euclidean(eye[1], eye[5])# 计算两个集合之间的欧式距离B = dist.euclidean(eye[2], eye[4])# 计算水平之间的欧几里得距离# 水平眼标志（X，Y）坐标C = dist.euclidean(eye[0], eye[3])# 眼睛长宽比的计算ear = (A + B) / (2.0 * C)# 返回眼睛的长宽比return ear# 定义两个常数# 眼睛长宽比# 闪烁阈值EYE_AR_THRESH = 0.2EYE_AR_CONSEC_FRAMES = 3# 初始化帧计数器和眨眼总数COUNTER = 0TOTAL = 0# 初始化DLIB的人脸检测器（HOG），然后创建面部标志物预测print("[INFO] loading facial landmark predictor...")# 第一步：使用dlib.get_frontal_face_detector() 获得脸部位置检测器detector = dlib.get_frontal_face_detector()# 第二步：使用dlib.shape_predictor获得脸部特征位置检测器predictor = dlib.shape_predictor('D:/myworkspace/JupyterNotebook/fatigue_detecting/model/shape_predictor_68_face_landmarks.dat')# 第三步：分别获取左右眼面部标志的索引(lStart, lEnd) = face_utils.FACIAL_LANDMARKS_IDXS["left_eye"](rStart, rEnd) = face_utils.FACIAL_LANDMARKS_IDXS["right_eye"]# 第四步：打开cv2 本地摄像头cap = cv2.VideoCapture(0)# 从视频流循环帧while True:# 第五步：进行循环，读取图片，并对图片做维度扩大，并进灰度化ret, frame = cap.read()frame = imutils.resize(frame, width=720)gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 第六步：使用detector(gray, 0) 进行脸部位置检测rects = detector(gray, 0)# 第七步：循环脸部位置信息，使用predictor(gray, rect)获得脸部特征位置的信息for rect in rects:shape = predictor(gray, rect)# 第八步：将脸部特征信息转换为数组array的格式shape = face_utils.shape_to_np(shape)# 第九步：提取左眼和右眼坐标leftEye = shape[lStart:lEnd]rightEye = shape[rStart:rEnd]# 第十步：构造函数计算左右眼的EAR值，使用平均值作为最终的EARleftEAR = eye_aspect_ratio(leftEye)rightEAR = eye_aspect_ratio(rightEye)ear = (leftEAR + rightEAR) / 2.0# 第十一步：使用cv2.convexHull获得凸包位置，使用drawContours画出轮廓位置进行画图操作leftEyeHull = cv2.convexHull(leftEye)rightEyeHull = cv2.convexHull(rightEye)cv2.drawContours(frame, [leftEyeHull], -1, (0, 255, 0), 1)cv2.drawContours(frame, [rightEyeHull], -1, (0, 255, 0), 1)# 第十二步：进行画图操作，用矩形框标注人脸left = rect.left()top = rect.top()right = rect.right()bottom = rect.bottom()cv2.rectangle(frame, (left, top), (right, bottom), (0, 255, 0), 3)    '''分别计算左眼和右眼的评分求平均作为最终的评分，如果小于阈值，则加1，如果连续3次都小于阈值，则表示进行了一次眨眼活动'''# 第十三步：循环，满足条件的，眨眼次数+1if ear < EYE_AR_THRESH:# 眼睛长宽比：0.2COUNTER += 1else:# 如果连续3次都小于阈值，则表示进行了一次眨眼活动if COUNTER >= EYE_AR_CONSEC_FRAMES:# 阈值：3TOTAL += 1# 重置眼帧计数器COUNTER = 0# 第十四步：进行画图操作，68个特征点标识for (x, y) in shape:cv2.circle(frame, (x, y), 1, (0, 0, 255), -1)# 第十五步：进行画图操作，同时使用cv2.putText将眨眼次数进行显示cv2.putText(frame, "Faces: {}".format(len(rects)), (10, 30),cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 255), 2)cv2.putText(frame, "Blinks: {}".format(TOTAL), (150, 30),cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 255), 2)cv2.putText(frame, "COUNTER: {}".format(COUNTER), (300, 30),cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 255), 2) cv2.putText(frame, "EAR: {:.2f}".format(ear), (450, 30),cv2.FONT_HERSHEY_SIMPLEX, 0.7, (0, 0, 255), 2)print('眼睛实时长宽比:{:.2f} '.format(ear))if TOTAL >= 50:cv2.putText(frame, "SLEEP!!!", (200, 200),cv2.FONT_HERSHEY_SIMPLEX, 0.8, (0, 0, 255), 2)cv2.putText(frame, "Press 'q': Quit", (20, 500),cv2.FONT_HERSHEY_SIMPLEX, 0.7, (84, 255, 159), 2)# 窗口显示 show with opencvcv2.imshow("Frame", frame)# if the `q` key was pressed, break from the loopif cv2.waitKey(1) & 0xFF == ord('q'):break# 释放摄像头 release cameracap.release()# do a bit of cleanupcv2.destroyAllWindows()

2.4 OpenCV

OpenCV是计算机视觉中一个经典的数据库。支持多语言、跨平台、功能强大。其提供了一个Python接口，用户可以在保证可读性和操作效率的前提下，用Python调用C/C++实现所需的功能。OpenCV是一个基于BSD许可证的跨平台计算机视觉库，可以在Linux、windows和Mac
OS操作系统上运行。它由一系列C函数和少量C++类组成。同时，它还提供了与Python、ruby、MATLAB等语言的接口，实现了图像处理和计算机视觉中的许多通用算法。

本项目中OpenCV主要是在图片的采集的图片的预处理方面使用，通过操作界面中的按钮选项选择是否打开摄像头，使用OpenCV来调用电脑摄像头来检测录像过程中的聚焦和人脸镜头的矫正等状态，然后在摄像头的录像的视频流中抓取对应的人脸照片，然后调用内部的函数对照片的尺寸和光线等进行矫正处理后，传给神经网络进行特征值提取。

3 功能介绍

3.1人脸录入功能

数据库数据录入

将采集到的人脸信息和姓名、学号录入到数据库中，数据库表如下图所示：

在这里插入图片描述

过程演示

在这里插入图片描述

3.2 人脸识别

在这里插入图片描述

3.3 人脸专注度检测

拍摄时间进行计时，在界面上实时输出该学生在课堂上的有效学习时间和学生在课堂上专注时间的比例
在这里插入图片描述

3.4 识别记录

在这里插入图片描述

4 最后

🧿 更多资料, 项目分享：

https://gitee.com/dancheng-senior/postgraduate

竞赛基于深度学习的人脸专注度检测计算系统 - opencv python cnn

文章目录 1 前言2 相关技术2.1CNN简介2.2 人脸识别算法2.3专注检测原理2.4 OpenCV 3 功能介绍3.1人脸录入功能3.2 人脸识别3.3 人脸专注度检测3.4 识别记录 4 最后 1 前言 🔥 优质竞赛项目系列，今天要分享的是 🚩 基于深度学习的人脸专注度…...

编程日记 2023/9/19 5:58:56

supervisord 进程管理器 Laravel执行队列

supervisord 进程管理器执行队列安装 yum install supervisor修改配置文件 /etc/supervisord.conf 最后一行 ini改为conf files=/etc/supervisor.d/*.conf vim /etc/supervisord.conf/etc/supervisord.d目录下新增配置文件 vim laravel-worker.conf 修改i 粘贴内容退出修…...

编程日记 2023/9/19 5:56:54

Lnmp架构之mysql数据库实战1

1、mysql数据库编译编译成功 2、mysql数据库初始化配置数据目录全局文件修改内容生成初始化密码并进行初始化设定 3、mysql主从复制什么是mysql的主从复制？ MySQL的主从复制是一种常见的数据库复制技术，用于将一个数据库服务器（称为主…...

编程日记 2023/9/19 5:54:52

ChatGLM 大模型炼丹手册-理论篇

序言一）大还丹的崛起在修真界，人们一直渴望拥有一种神奇的「万能型丹药」，可包治百病。但遗憾的是，在很长的一段时间里，炼丹师们只能对症炼药。每一枚丹药，都是特效药，专治一种病。这样就导致，每遇到一个新的问题，都需要针对性的炼制，炼丹师们苦不堪言，修真者们吐…...

编程日记 2023/9/19 5:53:51

Spring Boot集成Redis实现数据缓存

🌿欢迎来到衍生星球的CSDN博文🌿 🍁本文主要学习Spring Boot集成Redis实现数据缓存 🍁 🌱我是衍生星球，一个从事集成开发的打工人🌱 ⭐️喜欢的朋友可以关注一下🫰🫰&…...

编程日记 2023/9/19 5:52:50

CentOS 7 安装Libevent

CentOS 7 安装Libevent 1.下载安装包新版本是libevent-2.1.12-stable.tar.gz。（如果你的系统已经安装了libevent，可以不用安装） 官网：http://www.monkey.org/~provos/libevent/ 2.创建目录 # mkdir libevent-stable 3.解压 …...

编程日记 2023/9/19 5:51:49

线性代数的本质——几何角度理解

B站网课来自 3Blue1Brown的翻译版，看完醍醐灌顶，强烈推荐： 线性代数的本质本课程从几何的角度翻译了线代中各种核心的概念及性质，对做题和练习效果有实质性的提高，下面博主来总结一下自己的理解 1.向量的本质在物…...

编程日记 2023/9/19 5:50:48

SSH key 运作方式

1、本地创建SSH key pairs 2、把public key上传到网站服务器（如GitHub 3、当使用ssh方式连接时本地SSH client向远端请求ssh连接远端发来random data要求加密本地ssh client用private key加密，把加密的data发送过去（不发送private key远端接…...

编程日记 2023/9/19 5:49:47

【基于MBD开发模式的matlab持续集成（一）】

基于MBD开发模式的matlab持续集成引言或许是感受到行业内卷的愈加激烈，在传统制造和高新技术相结合的新能源领域对软件工程开发的要求也愈加提高，尤其在互联网已经大行其道的敏捷开发，便顺其自然的被新能源的老板们所看重。概述本文…...

编程日记 2023/9/19 5:48:46

Linux学习记录——이십팔 网络基础（1）

文章目录 1、了解2、网络协议栈3、TCP/IP模型4、网络传输1、同一局域网（子网）2、局域网通信原理3、跨一个路由器的两个子网4、其它详细的网络发展历史就不写了 1、了解为什么会出现网络？一开始多个计算机之间想要共享文件，就得…...

编程日记 2023/9/19 5:47:45

CSS动效合集之实现气泡发散动画

前言 👏CSS动效合集之实现气泡发散动画，速速来Get吧~ 🥇文末分享源代码。记得点赞关注收藏！ 1.实现效果 2.实现步骤定义一个数组bubbles，用来存储气泡列表的基本新，w表示宽高，x表示绝对定位…...

编程日记 2023/9/19 5:46:44

六、串口通信

六、串口通信串口接口介绍使用串口向电脑发送数据电脑发送数据控制LED灯串口接口介绍 SBUF是串口数据缓存器，物理上是两个独立的寄存器，但占用相同的地址。写操作时，写入的是发送寄存器；读操作时，读出的是接收寄存器…...

编程日记 2023/9/19 5:45:42

如何将 JavaScript Excel XLSX 查看器添加到Web应用程序

在 JavaScript 中创建 Excel 查看器可能是一项艰巨的任务，但使用 SpreadJS JavaScript 电子表格，创建过程要简单得多。在本教程博客中，我们将向您展示如何使用 SpreadJS 的强大功能来创建一个查看器，该查看器允许您在 Web 浏览器中…...

编程日记 2023/9/19 5:44:42

网安周报|CISA发布增强开源安全性的计划

1、CISA发布增强开源安全性的计划美国一家领先的安全机构发布了一项期待已久的计划，详细说明了它将如何增强联邦政府和整个生态系统的开源安全性。美国网络安全和基础设施安全局（CISA）开源软件安全路线图在安全开源峰会上发布。据估计&#…...

编程日记 2023/9/19 5:43:41

使用 Docker 安装 Elasticsearch （本地环境 M1 Mac）

Elasticsearchkibana下载安装 docker pull elasticsearch:7.16.2docker run --name es -d -e ES_JAVA_OPTS“-Xms512m -Xmx512m” -e “discovery.typesingle-node” -p 9200:9200 -p 9300:9300 elasticsearch:7.16.2docker pull kibana:7.16.2docker run --name kibana -e EL…...

编程日记 2023/9/19 5:42:40

文章目录

1 前言

2 相关技术

2.1CNN简介

2.2 人脸识别算法

2.3专注检测原理

2.4 OpenCV

3 功能介绍

3.1人脸录入功能

3.2 人脸识别

3.3 人脸专注度检测

3.4 识别记录

4 最后

相关文章：