当前位置：首页 > news >正文

竞赛选题深度学习驾驶行为状态检测系统(疲劳抽烟喝水玩手机) - opencv python

news 2026/5/16 4:34:34

文章目录

1 前言
1 课题背景
2 相关技术
- 2.1 Dlib人脸识别库
- 2.2 疲劳检测算法
- 2.3 YOLOV5算法
3 效果展示
- 3.1 眨眼
- 3.2 打哈欠
- 3.3 使用手机检测
- 3.4 抽烟检测
- 3.5 喝水检测
4 最后

1 前言

🔥 优质竞赛项目系列，今天要分享的是

🚩 基于深度学习的驾驶行为状态检测系统

该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！

🥇学长这里给一个题目综合评分(每项满分5分)

难度系数：3分
工作量：3分
创新点：5分

🧿 更多资料, 项目分享：

https://gitee.com/dancheng-senior/postgraduate

1 课题背景

为了有效监测驾驶员是否疲劳驾驶、避免交通事故的发⽣,本项目利⽤⼈脸特征点进⾏实时疲劳驾驶检测的新⽅法。对驾驶员驾驶时的⾯部图像进⾏实时监控,⾸先检测⼈脸,并利⽤ERT算法定位⼈脸特征点;然后根据⼈脸眼睛区域的特征点坐标信息计算眼睛纵横⽐EAR来描述眼睛张开程度,根据合适的EAR阈值可判断睁眼或闭眼状态;最后基于EAR实测值和EAR阈值对监控视频计算闭眼时间⽐例(PERCLOS)值度量驾驶员主观疲劳程度,将其与设定的疲劳度阈值进⾏⽐较即可判定是否疲劳驾驶。

2 相关技术

2.1 Dlib人脸识别库

简历
Dlib是一个基于c++开发的开源数据工具库,其中包含了不少的机器学习的成熟算法与模型,相对于tensorflow和PyTorch,它用于图像处理以及人脸面部特征提取、分类及对比这几个方面比较具有通用性和优越性,因此,Dlib正在越来越广泛地应用在人脸识别技术领域。
Dlib具有独立使用的可移植代码。Dlib中的代码使用c++语言进行开发而成,使用独立封装,在不借助第三方数据库的情况下,可以直接移植到自己所需要设计的项目中进行使用。

Dlib优点

Dlib拥有全面的文档说明。作为一个开源的人脸数据库训练集,Dlib中有很多功能齐全的程序和文件,从人性化的角度而言的,Dlib在这一点上做的是非常不错的,因为它为每一个程序文档和文件都做了相对应的注释,这样开发者就可以迅速准确的调集程序文档来完成自己所需要的项目功能。
Dlib涵盖了支持功能完备的深度学习以及图像处理的各类算法。Dlib为开发者提供了机器深度学习的各类成熟的完备算法,并且在图像处理方面也为开发者带来了能够解决大多数实质问题的优良算法。例如基于SVM的递归和分类算法,以及专门用于面对大规模分类和递归的降维算法。当然还有能够对未知函数进行预分类和预测的相关向量机,其分类和预测训练是基于贝叶斯框架。

相关代码

import` `matplotlib.pyplot as plt
import` `dlib
import` `numpy as np
import` `glob
import` `re#正脸检测器
detector``=``dlib.get_frontal_face_detector()
#脸部关键形态检测器
sp``=``dlib.shape_predictor(r``"D:LBJAVAscriptshape_predictor_68_face_landmarks.dat"``)
#人脸识别模型
facerec ``=` `dlib.face_recognition_model_v1(r``"D:LBJAVAscriptdlib_face_recognition_resnet_model_v1.dat"``)#候选人脸部描述向量集
descriptors``=``[]photo_locations``=``[]for` `photo ``in` `glob.glob(r``'D:LBJAVAscriptfaces*.jpg'``):``photo_locations.append(photo)``img``=``plt.imread(photo)``img``=``np.array(img)``#开始检测人脸``dets``=``detector(img,``1``)``for` `k,d ``in` `enumerate``(dets):``#检测每张照片中人脸的特征``shape``=``sp(img,d)``face_descriptor``=``facerec.compute_face_descriptor(img,shape)``v``=``np.array(face_descriptor)``descriptors.append(v)#输入的待识别的人脸处理方法相同
img``=``plt.imread(r``'D:test_photo10.jpg'``)
img``=``np.array(img)
dets``=``detector(img,``1``)
#计算输入人脸和已有人脸之间的差异程度（比如用欧式距离来衡量）
differences``=``[]
for` `k,d ``in` `enumerate``(dets):``shape``=``sp(img,d)``face_descriptor``=``facerec.compute_face_descriptor(img,shape)``d_test``=``np.array(face_descriptor)``#计算输入人脸和所有已有人脸描述向量的欧氏距离``for` `i ``in` `descriptors:``distance``=``np.linalg.norm(i``-``d_test)``differences.append(distance)#按欧式距离排序 欧式距离最小的就是匹配的人脸
candidate_count``=``len``(photo_locations)
candidates_dict``=``dict``(``zip``(photo_locations,differences))
candidates_dict_sorted``=``sorted``(candidates_dict.items(),key``=``lambda` `x:x[``1``])#matplotlib要正确显示中文需要设置
plt.rcParams[``'font.family'``] ``=` `[``'sans-serif'``]
plt.rcParams[``'font.sans-serif'``] ``=` `[``'SimHei'``]plt.rcParams[``'figure.figsize'``] ``=` `(``20.0``, ``70.0``)ax``=``plt.subplot(candidate_count``+``1``,``4``,``1``)
ax.set_title(``"输入的人脸"``)
ax.imshow(img)for` `i,(photo,distance) ``in` `enumerate``(candidates_dict_sorted):``img``=``plt.imread(photo)``face_name``=``""``photo_name``=``re.search(r``'([^\]*).jpg$'``,photo)``if` `photo_name:``face_name``=``photo_name[``1``]``ax``=``plt.subplot(candidate_count``+``1``,``4``,i``+``2``)``ax.set_xticks([])``ax.set_yticks([])``ax.spines[``'top'``].set_visible(``False``)``ax.spines[``'right'``].set_visible(``False``)``ax.spines[``'bottom'``].set_visible(``False``)``ax.spines[``'left'``].set_visible(``False``)``if` `i``=``=``0``:``ax.set_title(``"最匹配的人脸nn"``+``face_name``+``"nn差异度："``+``str``(distance))``else``:``ax.set_title(face_name``+``"nn差异度："``+``str``(distance))``ax.imshow(img)plt.show()

2.2 疲劳检测算法

该系统采用Dlib库中人脸68个关键点检测shape＿predictor＿68＿face＿landmarks.dat的dat模型库及视频中的人脸，之后返回人脸特征点坐标、人脸框及人脸角度等。本系统利用这68个关键点对驾驶员的疲劳状态进行检测，算法如下：

初始化Dlib的人脸检测器(HOG)，然后创建面部标志物预测；
使用dlib.get＿frontal＿face＿detector() 获得脸部位置检测器；
使用dlib.shape＿predictor获得脸部特征位置检测器；
分别获取左、右眼面部标志的索引；
打开cv2本地摄像头。

Dlib库68个特征点模型如图所示：

眼睛检测算法

基于EAR算法的眨眼检测，当人眼睁开时，EAR在某个值域范围内波动，当人眼闭合时，EAR迅速下降，理论上接近于0。当EAR低于某个阈值时，眼睛处于闭合状态；当EAR由某个值迅速下降至小于该阈值，再迅速上升至大于该阈值，则判断为一次眨眼。为检测眨眼次数，需要设置同一次眨眼的连续帧数。眨眼速度较快，一般1～3帧即可完成眨眼动作。眼部特征点如图：
在这里插入图片描述
EAR计算公式如下：

当后帧眼睛宽高比与前一帧差值的绝对值(EAR)大于0.2时，认为驾驶员在疲劳驾驶。（68点landmark中可以看到37-42为左眼，43-48为右眼）

右眼开合度可以通过以下公式：

眼睛睁开度从大到小为进入闭眼期，从小到大为进入睁眼期，计算最长闭眼时间(可用帧数来代替)。闭眼次数为进入闭眼、进入睁眼的次数。通过设定单位时间内闭眼次数、闭眼时间的阈值判断人是否已经疲劳了。

2.3 YOLOV5算法

简介
我们选择当下YOLO最新的卷积神经网络YOLOv5来进行检测是否存在玩手机、抽烟、喝水这三种行为。6月9日，Ultralytics公司开源了YOLOv5，离上一次YOLOv4发布不到50天。而且这一次的YOLOv5是完全基于PyTorch实现的！在我们还对YOLOv4的各种高端操作、丰富的实验对比惊叹不已时，YOLOv5又带来了更强实时目标检测技术。按照官方给出的数目，现版本的YOLOv5每个图像的推理时间最快0.007秒，即每秒140帧（FPS），但YOLOv5的权重文件大小只有YOLOv4的1/9。

目标检测架构分为两种，一种是two-stage，一种是one-stage，区别就在于 two-stage 有region
proposal过程，类似于一种海选过程,网络会根据候选区域生成位置和类别，而one-stage直接从图片生成位置和类别。今天提到的 YOLO就是一种
one-stage方法。YOLO是You Only Look Once的缩写,意思是神经网络只需要看一次图片，就能输出结果。YOLO
一共发布了五个版本，其中 YOLOv1 奠定了整个系列的基础，后面的系列就是在第一版基础上的改进，为的是提升性能。

YOLOv5有4个版本性能如图所示：
在这里插入图片描述
网络架构图

3 效果展示

3.1 眨眼

在这里插入图片描述

3.2 打哈欠

在这里插入图片描述

3.3 使用手机检测

在这里插入图片描述

3.4 抽烟检测

在这里插入图片描述

3.5 喝水检测

在这里插入图片描述

4 最后

🧿 更多资料, 项目分享：

https://gitee.com/dancheng-senior/postgraduate

竞赛选题深度学习驾驶行为状态检测系统(疲劳抽烟喝水玩手机) - opencv python

文章目录 1 前言1 课题背景2 相关技术2.1 Dlib人脸识别库2.2 疲劳检测算法2.3 YOLOV5算法 3 效果展示3.1 眨眼3.2 打哈欠3.3 使用手机检测3.4 抽烟检测3.5 喝水检测 4 最后 1 前言 🔥 优质竞赛项目系列，今天要分享的是 🚩 基于深度学习的驾…...

编程日记 2023/11/18 14:24:55

59 权限提升-Win溢出漏洞及ATSCPS提权

目录知识点必备：windows权限认识(用户及用户组)0x01 普通权限0x02特殊权限演示案例:基于WEB环境下的权限提升-阿里云靶机基于本地环境下的权限提升-系统溢出漏洞基于本地环境下的权限提升-AT&SC&PS命令案例给到的思路点总结如下:涉及资源: 这个章节会讲到…...

编程日记 2023/11/18 14:23:54

【新闻稿】Solv 与 zCloak 联合开发跨境贸易场景下可编程数字凭证项目，获得新加坡、加纳两国央行支持...

关于昨天 Solv 携手 zCloak 与新加坡和加纳两个央行合作的 Project DESFT，很多朋友都发来恭喜和祝福，并希望了解详情。这个事我们秘密努力了半年多，终于有一个阶段性的成果。这里我转载中文版官宣新闻稿，欢迎大家关注。等我忙过这…...

编程日记 2023/11/18 14:22:53

requests库进行爬虫ip请求时遇到的错误解决方法

问题背景在使用requests库进行HTTP请求时，用户遇到了一个AuthenticationRequired（身份验证必须）的错误。然而，当使用urllib.request.urlopen执行相同的操作时，却能够成功。同时，用户提供了自己的系统信息…...

编程日记 2023/11/18 14:21:52

目标检测—YOLO系列(二 ) 全面解读论文与复现代码YOLOv1 PyTorch

精读论文前言从这篇开始，我们将进入YOLO的学习。YOLO是目前比较流行的目标检测算法，速度快且结构简单，其他的目标检测算法如RCNN系列，以后有时间的话再介绍。本文主要介绍的是YOLOV1，这是由以Joseph Redmon为首的…...

编程日记 2023/11/18 14:20:51

Redis维护缓存的方案选择

Redis中间件常常被用作缓存，而当使用了缓存的时候，缓存中数据的维护，往往是需要重点关注的，尤其是重点考虑的是数据一致性问题。以下是维护数据库缓存的一些常用方案。 1、先删除缓存，再更新数据库导致数据不一致的…...

编程日记 2023/11/18 14:19:50

LeetCode236. Lowest Common Ancestor of a Binary Tree

文章目录一、题目二、题解一、题目 Given a binary tree, find the lowest common ancestor (LCA) of two given nodes in the tree. According to the definition of LCA on Wikipedia: “The lowest common ancestor is defined between two nodes p and q as the lowest…...

编程日记 2023/11/18 14:18:49

基于Gin+Gorm框架搭建MVC模式的Go语言企业级后端系统

文/朱季谦环境准备：安装Gin与Gorm 本文搭建准备环境：GinGormMySql。 Gin是Go语言的一套WEB框架，在学习一种陌生语言的陌生框架，最好的方式，就是用我们熟悉的思维去学。作为一名后端Java开发，在最初入门…...

编程日记 2023/11/18 14:17:48

【开源】基于Vue和SpringBoot的固始鹅块销售系统

项目编号： S 060 ，文末获取源码。 \color{red}{项目编号：S060，文末获取源码。} 项目编号：S060，文末获取源码。目录一、摘要1.1 项目介绍1.2 项目录屏二、功能模块2.1 数据中心模块2.2 鹅块类型模块2.3 固…...

编程日记 2023/11/18 14:16:47

Windows11怎样投屏到电视上？

电视屏幕通常比电脑显示器更大，能够提供更逼真的图像和更震撼的音效，因此不少人也喜欢将电脑屏幕投屏到电视上，缓解一下低头看电脑屏幕的烦恼。 Windows11如何将屏幕投射到安卓电视？ 你需要在电脑和电视分贝安装AirDroid Cast的电…...

编程日记 2023/11/18 14:15:46

ubuntu中用docker部署jenkins，并和码云实现自动化部署

1.部署jenkins docker network create jenkins docker run --name jenkins-docker --rm --detach \--privileged --network jenkins --network-alias docker \--env DOCKER_TLS_CERTDIR/certs \--volume jenkins-docker-certs:/certs/client \--volume jenkins-data:/var/jen…...

编程日记 2023/11/18 14:14:45

for,while,do-while,死循环,嵌套循环,跳转关键字,随机数

1.for循环 public class ForDemo1 {public static void main(String[] args) {for (int i 0; i < 5; i) {System.out.println("HelloWorld");}System.out.println("--------------------------------------------");for (int i 1; i <10 ; i) {Sy…...

编程日记 2023/11/18 14:12:44

【六袆 - MySQL】SQL优化；Explain SQL执行计划分析；

Explain SQL执行计划分析概念：English Unit案例分析1.分析的SQL2.执行计划分析【如图】MySQL执行计划参数以及它们的影响或意义：概念： MySQL执行计划（Execution Plan）是数据库系统根据查询语句生成的一种执行策略，用于指导数据库引擎执行查询操作。 English Unit This…...

编程日记 2023/11/18 14:11:42

【AI视野·今日NLP 自然语言处理论文速览第六十二期】Wed, 25 Oct 2023

AI视野今日CS.NLP 自然语言处理论文速览 Wed, 25 Oct 2023 (showing first 100 of 112 entries) Totally 100 papers 👉上期速览✈更多精彩请移步主页 Daily Computation and Language Papers MuSR: Testing the Limits of Chain-of-thought with Multistep Soft R…...

编程日记 2023/11/18 14:10:41

各种符号地址，可以直接复制粘贴使用

字符符号 - 文本数字工具 | 偷懒工具 toolight.cn...

编程日记 2023/11/18 14:09:39

C语言测试题：用冒泡法对输入的10个字符由小到大排序，要求数组做为函数参数。

编写一个函数： 用冒泡法对输入的10个字符由小到大排序 ，要求数组做为函数参数。冒泡排序是一种简单的排序算法，它会多次遍历要排序的数列， 每次遍历时，依次比较相邻的两个元素，如果它们的顺序不符合要求…...

编程日记 2023/11/18 14:08:38

uni-app开发微信小程序 vue3写法添加pinia

说明使用uni-app开发，选择vue3语法，开发工具是HBliuderX。虽然内置有vuex，但是个人还是喜欢用Pinia，所以就添加进去了。 Pinia官网连接添加步骤第一步： 在项目根目录下执行命令： npm install pinia …...

编程日记 2023/11/18 14:07:36

centos三台主机配置互信ssh登录

1. 修改hosts信息 1.1三台主机上分别修改hosts文件 vi /etc/hosts1.2 三台主机分别填入如下内容，ip地址需要检查正确 192.168.126.223 node1 192.168.126.224 node2 192.168.126.225 node32. 秘钥生成和分发 2.1 在三台主机上分别生成秘钥命令输入后&#xff…...

编程日记 2023/11/18 14:06:35

验证码案例 —— Kaptcha 插件介绍后端生成验证码，前端展示并进行session验证（带完整前后端源码）

🧸欢迎来到dream_ready的博客，📜相信你对这篇博客也感兴趣o (ˉ▽ˉ；) 📜表白墙/留言墙 —— 中级SpringBoot项目，MyBatis技术栈MySQL数据库开发，练手项目前后端开发(带完整源码) 全方位全步骤手…...

编程日记 2023/11/18 14:05:34

js/jQuery 的一些常用操作（js/jQuery获取表单元素值以及清空元素值的各种实现方式）——附测试例子，拿来即能实现效果

js/jQuery 的一些常用操作（js/jQuery获取表单元素值以及清空元素值的各种实现方式）——附测试例子，拿来即能实现效果 1. 前言2. 获取表单元素的值2.1 简单获取元素中的值2.1.1 根据 id 简单取值2.2.2 根据name 简单取值2.1.3 获取单选按钮的…...

编程日记 2023/11/18 14:04:33

如何利用QGIS 3.22为机器学习任务高效构建遥感影像切片数据集

1. 为什么需要QGIS处理遥感影像数据做机器学习项目时，最头疼的就是数据准备环节。特别是处理遥感影像这种"庞然大物"，动辄几个GB的高分辨率图像，直接用Python脚本处理不仅效率低，还容易内存溢出。去年我做城市绿地识别…...

编程新知 2026/5/16 2:24:44

图片换背景底色怎么制作？2026年最全工具对比和实操指南

前几天，有个朋友问我怎样快速给证件照换个蓝色背景，我才意识到很多人其实不知道现在换背景底色有多简单。无论是证件照、商品图、还是自媒体头图，一键就能搞定。今天我就把自己用过的所有工具和方法整理出来，分享给大家。为什么越…...

编程新知 2026/5/16 2:07:25

API管理平台能力与数据盘点

API管理平台是现代企业IT架构中的核心组件，承担着接口设计、发布、运维、安全管控及生态开放等关键职责。不同平台在功能深度、性能指标和行业实践上各有积累。本文基于公开资料，对五款API管理平台的核心能力与关键数据进行客观梳理，以表格与…...

编程新知 2026/5/16 1:34:17

15分钟掌握ColorUI：打造高颜值小程序的终极色彩解决方案

15分钟掌握ColorUI：打造高颜值小程序的终极色彩解决方案【免费下载链接】coloruicss 鲜亮的高饱和色彩，专注视觉的小程序组件库项目地址: https://gitcode.com/gh_mirrors/co/coloruicss 还在为小程序界面设计而烦恼吗？ColorUI色彩系…...

编程新知 2026/5/16 1:17:42

AI编程助手规则库实战：从通用到专用的效率跃迁

1. 项目概述：当你的光标有了“规矩”最近在逛GitHub的时候，发现了一个挺有意思的项目，叫“awesome-cursorrules-zh”。光看名字，你可能会有点懵，“Cursor”是那个AI编程工具，“rules”是规则，那…...

编程新知 2026/5/16 0:58:14

5分钟快速上手COLA架构：构建清晰分层的企业级应用完整指南

5分钟快速上手COLA架构：构建清晰分层的企业级应用完整指南【免费下载链接】COLA 🥤 COLA: Clean Object-oriented & Layered Architecture 项目地址: https://gitcode.com/gh_mirrors/col/COLA COLA（Clean Object-oriented &…...

编程新知 2026/5/16 0:50:00

n8n工作流模板大全：从入门到精通的自动化实战指南

1. 项目概述：一个为n8n用户准备的“万能工具箱” 如果你正在使用或者听说过n8n这个强大的工作流自动化工具，那你一定遇到过这样的时刻：面对一个空白的画布，知道n8n能帮你连接一切，但就是不知道从何下手，或…...

编程新知 2026/5/16 0:34:57

不止是记事本！Win10右键新建菜单终极自定义指南：排序、删除、添加任意文件类型

不止是记事本！Win10右键新建菜单终极自定义指南：排序、删除、添加任意文件类型在Windows 10的日常使用中，右键新建菜单可能是最容易被忽视却高频使用的功能之一。想象一下这样的场景：你刚刚安装了一款专业设计软件，却…...

编程新知 2026/5/15 23:31:10

B站成分检测器：3分钟快速安装指南，智能识别评论区用户真实身份

B站成分检测器：3分钟快速安装指南，智能识别评论区用户真实身份【免费下载链接】bilibili-comment-checker B站评论区自动标注成分，支持动态和关注识别以及手动输入 UID 识别项目地址: https://gitcode.com/gh_mirrors/bil/bilibili-comme…...

编程新知 2026/5/15 21:41:48

DellFanManagement终极指南：如何彻底掌控戴尔笔记本风扇噪音与散热平衡

DellFanManagement终极指南：如何彻底掌控戴尔笔记本风扇噪音与散热平衡【免费下载链接】DellFanManagement A suite of tools for managing the fans in many Dell laptops. 项目地址: https://gitcode.com/gh_mirrors/de/DellFanManagement 还在为戴尔笔记…...

编程新知 2026/5/15 21:29:23

文章目录

1 前言

1 课题背景

2 相关技术

2.1 Dlib人脸识别库

2.2 疲劳检测算法

2.3 YOLOV5算法

3 效果展示

3.1 眨眼

3.2 打哈欠

3.3 使用手机检测

3.4 抽烟检测

3.5 喝水检测

4 最后

相关文章：