当前位置：首页 > news >正文

《OpenCV》——dlib（人脸应用实例）

news 2025/7/8 7:36:02

文章目录

- dlib库
- dlib库——人脸应用实例——表情识别
- dlib库——人脸应用实例——疲劳检测

dlib库

dlib库的基础用法介绍可以参考这篇文章：https://blog.csdn.net/lou0720/article/details/145968062?spm=1011.2415.3001.5331，故此这篇文章只介绍dlib的人脸应用实例。

dlib库——人脸应用实例——表情识别

在这里插入图片描述
代码：

import numpy as np
import cv2
import dlib
from sklearn.metrics.pairwise import euclidean_distances
from PIL import Image, ImageDraw, ImageFontdef cv2AddChineseText(img, text, position, textColor=(0, 255, 0), textSize=20):""" 向图片中添加中文 """# 判断输入的 img 是否为 OpenCV 格式的图片（即 numpy.ndarray 类型）if isinstance(img, np.ndarray):# 如果是 OpenCV 格式，将其从 BGR 颜色空间转换为 RGB 颜色空间，# 因为 PIL 库使用 RGB 颜色空间，而 OpenCV 使用 BGR 颜色空间img = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))# 在 img 图片上创建一个绘图对象，用于后续绘制文本draw = ImageDraw.Draw(img)# 定义字体的格式，使用 "simsun.ttc" 字体文件，指定字体大小为 textSize，# 并设置编码为 UTF - 8 以支持中文显示fontStyle = ImageFont.truetype("simsun.ttc", textSize, encoding="utf-8")# 在指定的 position 位置，使用指定的 textColor 颜色和 fontStyle 字体绘制文本draw.text(position, text, textColor, font=fontStyle)# 将绘制好文本的 PIL 图片转换回 numpy.ndarray 类型，并将颜色空间从 RGB 转换回 BGR，# 以符合 OpenCV 的要求return cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR)def MAR(shape):"""计算嘴巴纵横比（Mouth Aspect Ratio）:param shape: 68 个人脸特征点的坐标数组:return: 嘴巴纵横比"""# 计算嘴巴上下部分特定点之间的欧氏距离A = euclidean_distances(shape[50].reshape(1, 2), shape[58].reshape(1, 2))B = euclidean_distances(shape[51].reshape(1, 2), shape[57].reshape(1, 2))C = euclidean_distances(shape[52].reshape(1, 2), shape[56].reshape(1, 2))# 计算嘴巴左右两侧特定点之间的欧氏距离D = euclidean_distances(shape[48].reshape(1, 2), shape[54].reshape(1, 2))# 计算嘴巴纵横比，即上下部分平均距离与左右距离的比值return ((A + B + C) / 3) / Ddef MJR(shape):"""计算嘴巴与下巴宽度比（Mouth to Jaw Ratio）:param shape: 68 个人脸特征点的坐标数组:return: 嘴巴与下巴宽度比"""# 计算嘴巴左右两侧特定点之间的欧氏距离M = euclidean_distances(shape[48].reshape(1, 2), shape[54].reshape(1, 2))# 计算下巴左右两侧特定点之间的欧氏距离J = euclidean_distances(shape[3].reshape(1, 2), shape[13].reshape(1, 2))# 计算嘴巴与下巴宽度比return M / Jdef MBR(shape):"""计算眉毛间距比（Mouth to Brow Ratio）:param shape: 68 个人脸特征点的坐标数组:return: 眉毛间距比"""# 计算左右眉毛内侧特定点之间的欧氏距离F = euclidean_distances(shape[21].reshape(1, 2), shape[22].reshape(1, 2))# 计算左右眉毛外侧特定点之间的欧氏距离I = euclidean_distances(shape[17].reshape(1, 2), shape[26].reshape(1, 2))# 计算眉毛间距比return F / I# 打开默认摄像头，用于实时视频捕获
cap = cv2.VideoCapture(0)
# 加载预训练的 68 点人脸特征预测模型
predictor = dlib.shape_predictor('shape_predictor_68_face_landmarks.dat')
# 创建人脸检测器对象
detector = dlib.get_frontal_face_detector()while True:# 从摄像头读取一帧视频ret, frame = cap.read()# 水平翻转视频帧，使画面看起来更自然frame = cv2.flip(frame, 1)# 如果读取失败，跳出循环if ret is None:break# 检测视频帧中的人脸faces = detector(frame, 0)for face in faces:# 预测人脸的 68 个特征点shape = predictor(frame, face)# 将特征点转换为 numpy 数组shape = np.array([[p.x, p.y] for p in shape.parts()])# 计算嘴巴纵横比mar = MAR(shape)# 计算嘴巴与下巴宽度比mjr = MJR(shape)# 计算眉毛间距比mbr = MBR(shape)# 初始化表情结果为正常result = '正常'# 打印各个比值print("mar", mar, '\tmjr', mjr, 'mbr', mbr)# 根据比值判断表情if mar > 0.5:result = "大笑"elif mjr > 0.45:result = '微笑'elif mbr < 0.15:result = '生气'# 计算嘴巴轮廓的凸包mouthHull = cv2.convexHull(shape[48:61])# 在视频帧上添加中文表情结果frame = cv2AddChineseText(frame, result, mouthHull[0, 0])# 在视频帧上绘制嘴巴轮廓cv2.drawContours(frame, [mouthHull], -1, (0, 255, 0), 1)# 显示处理后的视频帧cv2.imshow('img', frame)# 等待用户按键，等待时间为 1 毫秒key = cv2.waitKey(1)# 如果用户按下 ESC 键（ASCII 码为 27），跳出循环if key == 27:break
# 释放摄像头资源
cap.release()
# 关闭所有 OpenCV 窗口
cv2.destroyAllWindows()

在这里插入图片描述

dlib库——人脸应用实例——疲劳检测

在这里插入图片描述

当闭眼时间长时，发出危险警告。

代码：

import numpy as np
import cv2
import dlib
from sklearn.metrics.pairwise import euclidean_distances
from PIL import Image, ImageDraw, ImageFontdef cv2AddChineseText(img, text, position, textColor=(0, 255, 0), textSize=20):""" 向图片中添加中文 """# 判断输入的 img 是否为 OpenCV 格式的图片（即 numpy.ndarray 类型）if isinstance(img, np.ndarray):# 如果是 OpenCV 格式，将其从 BGR 颜色空间转换为 RGB 颜色空间，# 因为 PIL 库使用 RGB 颜色空间，而 OpenCV 使用 BGR 颜色空间img = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))# 在 img 图片上创建一个绘图对象，用于后续绘制文本draw = ImageDraw.Draw(img)# 定义字体的格式，使用 "simsun.ttc" 字体文件，指定字体大小为 textSize，# 并设置编码为 UTF - 8 以支持中文显示fontStyle = ImageFont.truetype("simsun.ttc", textSize, encoding="utf-8")# 在指定的 position 位置，使用指定的 textColor 颜色和 fontStyle 字体绘制文本draw.text(position, text, textColor, font=fontStyle)# 将绘制好文本的 PIL 图片转换回 numpy.ndarray 类型，并将颜色空间从 RGB 转换回 BGR，# 以符合 OpenCV 的要求return cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR)def eye_aspect_ratio(eye):"""计算眼睛的纵横比（Eye Aspect Ratio，EAR）:param eye: 眼睛的特征点坐标数组:return: 眼睛的纵横比"""# 计算眼睛垂直方向上的距离A = euclidean_distances(eye[1].reshape(1, 2), eye[5].reshape(1, 2))B = euclidean_distances(eye[2].reshape(1, 2), eye[4].reshape(1, 2))# 计算眼睛水平方向上的距离C = euclidean_distances(eye[0].reshape(1, 2), eye[3].reshape(1, 2))# 计算眼睛纵横比，即垂直方向平均距离与水平距离的比值ear = ((A + B) / 2) / Creturn eardef drawEye(eye):"""在图像上绘制眼睛的轮廓:param eye: 眼睛的特征点坐标数组"""# 计算眼睛特征点的凸包eyeHull = cv2.convexHull(eye)# 在图像 frame 上绘制眼睛的轮廓cv2.drawContours(frame, [eyeHull], -1, (0, 255, 0), 1)# 初始化计数器，用于记录眼睛闭合的帧数
COUNTER = 0
# 创建人脸检测器对象，用于检测图像中的人脸
detector = dlib.get_frontal_face_detector()
# 打开默认摄像头，用于实时视频捕获
cap = cv2.VideoCapture(0)
# 加载预训练的 68 点人脸特征预测模型
predictor = dlib.shape_predictor('shape_predictor_68_face_landmarks.dat')while True:# 从摄像头读取一帧视频ret, frame = cap.read()# 水平翻转视频帧，使画面看起来更自然frame = cv2.flip(frame, 1)# 如果读取失败，跳出循环if ret is None:break# 检测视频帧中的人脸faces = detector(frame, 0)for face in faces:# 预测人脸的 68 个特征点shape = predictor(frame, face)# 将特征点转换为 numpy 数组shape = np.array([[p.x, p.y] for p in shape.parts()])# 提取右眼的特征点rightEye = shape[36:42]# 提取左眼的特征点leftEye = shape[42:48]# 计算右眼的纵横比rightEAR = eye_aspect_ratio(rightEye)# 计算左眼的纵横比leftEAR = eye_aspect_ratio(leftEye)# 计算左右眼纵横比的平均值ear = (leftEAR + rightEAR) / 2# 如果眼睛纵横比小于 0.3，认为眼睛处于闭合状态if ear < 0.3:# 闭合帧数计数器加 1COUNTER += 1# 如果闭合帧数超过 50 帧，认为可能存在危险情况if COUNTER >= 50:# 在视频帧上添加中文提示信息frame = cv2AddChineseText(frame, "！！！危险！！！", (250, 250))else:# 如果眼睛处于睁开状态，将闭合帧数计数器重置为 0COUNTER = 0# 绘制左眼的轮廓drawEye(leftEye)# 绘制右眼的轮廓drawEye(rightEye)# 格式化眼睛纵横比信息，保留两位小数info = "EAR:{:.2f}".format(ear[0][0])# 在视频帧上添加眼睛纵横比信息frame = cv2AddChineseText(frame, info, (0, 30))# 显示处理后的视频帧cv2.imshow('Frame', frame)# 等待用户按键，等待时间为 1 毫秒key = cv2.waitKey(1)# 如果用户按下 ESC 键（ASCII 码为 27），跳出循环if key == 27:break# 释放摄像头资源
cap.release()
# 关闭所有 OpenCV 窗口
cv2.destroyAllWindows()

在这里插入图片描述

《OpenCV》——dlib（人脸应用实例）

文章目录 dlib库dlib库——人脸应用实例——表情识别dlib库——人脸应用实例——疲劳检测 dlib库 dlib库的基础用法介绍可以参考这篇文章：https://blog.csdn.net/lou0720/article/details/145968062?spm1011.2415.3001.5331，故此这篇文章只介绍dlib的人…...

编程日记 2025/3/8 23:53:47

接口开发笔记-WebApi-CSDN博客以太网常用通讯协议 1、modbus tcp using EasyModbus; using System;class Program {static void Main(string[] args){// 创建Modbus客户端实例ModbusClient modbusClient new ModbusClient("192.168.1.100"); // IP地址modbusCli…...

编程日记 2025/3/8 23:46:39

UDP学习笔记（一）为什么UDP需要先将数据转换为字节数组

UDP 发送数据时需要先将数据转换为字节数组再发送，主要是因为计算机网络传输的最基本单位是“字节”（Byte）。让我们从以下几个方面来深入理解这个设计选择： 1. 计算机网络只能传输“字节” 在网络通信中，无论是 TCP 还…...

编程日记 2025/3/8 23:38:32

数据分析/数据科学常见SQL题目：连续登录用户、留存率、最大观看人数

文章目录 1. SQL的执行顺序是什么？on和join谁先执行，为什么？on和where的区别？2. 已知表user,字段id, date，求新用户的次日留存率3. 已知表user，字段id，date，求每个日期新用户的次日留…...

编程日记 2025/3/8 23:34:27

【Conda】Windows安装conda/Anaconda环境

安装conda并配置powershell 访问该网址，下载安装即可： Anaconda下载安装完成后，打开Anaconda，并访问Powershell Prompt 弹出Windows Terminal，并正常进入Conda 【非必须】如果不是通过Windows Terminal打开&#x…...

编程日记 2025/3/8 23:32:25

olmOCR：高效精准的 PDF 文本提取工具

在日常的工作和学习中，是否经常被 PDF 文本提取问题困扰？例如： 想从学术论文 PDF 中提取关键信息，却发现传统 OCR 工具识别不准确或文本格式混乱？需要快速提取商务合同 PDF 中的条款内容，却因工具不给力而…...

编程日记 2025/3/8 23:31:23

数字投屏叫号器-发射端python窗口定制

窗口本系列前章介绍，叫号器的显示端，完成了视频音频的形成和传输的介绍。本章节开始定制小窗口。最终实现，处于桌面最前端，发送指令，集合前篇即可完成： 处理本地text.txt更新，随之被rtsp采集…...

编程日记 2025/3/8 23:28:18

从零开始实现大语言模型（十四）：高阶训练技巧

1. 前言预训练大语言模型的流程与训练普通神经深度网络模型本质上并没有任何不同。可以使用深度学习实践中已经被证明非常有效的高阶训练技巧，优化大语言模型预训练流程，使大语言模型预训练效率更高，训练过程更稳定。本文介绍深度学习领域…...

编程日记 2025/3/8 23:22:12

Spring-framework源码编译

版本统一（搭配其他版本会遇到不可知错误）： 1）spring 5.2.X（5.5.26） 2）JDK8 3）Gradle:5.6.4 可以在gradle-wrapper.properties中修改 https\://services.gradle.org/distribution…...

编程日记 2025/3/8 23:14:04

分布式系统的核心挑战与解决方案

1、分布式系统的引入在移动互联网、云计算和物联网的推动下，现代软件系统需要处理亿级用户请求、PB级数据存储和毫秒级响应需求。传统的单体架构受限于单机性能瓶颈和容灾能力，逐渐被分布式系统取代。例如，电商平台在“双十一”期间需应对每…...

编程日记 2025/3/8 23:11:00

fastjson漏洞

fastjson漏洞 fastjson工作原理攻击原理补充例子 fastjson工作原理 fastjson的作用是将JAVA对象转换成对应的json表示形式，也可以反过来将json转化为对应的Java对象。fastjson使用AutoType功能进行反序列化，AutoType使用type标记字符的原始类型&#x…...

编程日记 2025/3/8 23:07:56

upload-labs详解（13-20）文件上传分析

目录 upload-labs-env upload-labs-env第十三关文件包含漏洞代码测试上传一个.jpg图片上传一个.png文件上传一个.gif图片 upload-labs-env第十四关代码思路 upload-labs-env第十五关代码思路 upload-labs-env第十六关代码思路测试上传gif格式…...

编程日记 2025/3/8 23:00:49

HTML第四节

一.复合选择器 1.后代选择器注：1.后代选择器会选中后代所有的要选择的标签 2.儿子选择器 3.并集选择器注：1.注意换行，同时选中多种标签 4.交集选择器注：1.标签选择器放在最前面，例如放在类选择器的前面 2.两个选择…...

编程日记 2025/3/8 22:59:48

基于 LeNet 网络的 MNIST 数据集图像分类

1.LeNet的原始实验数据集MNIST 名称：MNIST手写数字数据集数据类型：灰度图 （一通道） 图像大小：28*28 类别数：10类（数字0-9） 1.通过torchvision.datasets.MNIST下载并保存到本地…...

编程日记 2025/3/8 22:56:45

win11编译llama_cpp_python cuda128 RTX30/40/50版本

Geforce 50xx系显卡最低支持cuda128，llama_cpp_python官方源只有cpu版本，没有cuda版本，所以自己基于0.3.5版本源码编译一个RTX 30xx/40xx/50xx版本。 1. 前置条件 1. 访问https://developer.download.nvidia.cn/compute/cuda/12.8.0/local_…...

编程日记 2025/3/8 22:52:40

Spring Boot静态资源访问顺序

在 Spring Boot 中，static 和 public 目录都用于存放静态资源（如 HTML、CSS、JavaScript、图片等文件），但它们在使用上有一些细微的区别。以下是它们的详细对比： 1. 默认优先级 Spring Boot 会按照以下优先级加载静态…...

编程日记 2025/3/8 22:46:35

电脑总显示串口正在被占用处理方法

1.现象在嵌入式开发过程中，有很多情况下要使用串口调试，其中485/422/232转usb串口是非常常见的做法。根据协议，接口芯片不同，需要安装对应的驱动程序，比如ch340，cp2102，CDM212364等驱动。可…...

编程日记 2025/3/8 22:41:30

工具介绍《HACKBAR V2》

HackBar V2 是一款功能强大的浏览器渗透测试工具，主要用于测试 SQL 注入、XSS 漏洞、POST 传参等安全场景。以下是其核心功能、用法及实际案例操作的综合介绍： 一、核心功能与用法详解 1. 基础操作 Load URL 功能：将当前浏览器地址栏的 URL …...

编程日记 2025/3/8 22:37:26

Java算法语法学习美丽子集的数目 - 力扣 Map接口

文章目录题目解题思路题解统计数组中每个数字按模k分组的出现次数，并保持数值有序作用 **merge(x, 1, Integer::sum)**解释**检查键是否存在**:**合并现有值**: 示例在代码中的应用**计算余数**:**存储余数及其出现次数**: merge 的常见用法统计频率合并字符串合并…...

编程日记 2025/3/8 22:34:23

Vue项目通过内嵌iframe访问另一个vue页面，获取token适配后端鉴权(以内嵌若依项目举例)

1. 改造子Vue项目进行适配(ruoyi举例) (1) 在路由文件添加需要被外链的vue页面配置 // 若依项目的话是 router/index.js文件 {path: /contrast,component: () > import(/views/contrast/index),hidden: true },(2) 开放白名单 // 若依项目的话是 permission.js 文件 cons…...

编程日记 2025/3/8 22:30:18

质量体系的重要

质量体系是为确保产品、服务或过程质量满足规定要求，由相互关联的要素构成的有机整体。其核心内容可归纳为以下五个方面： 🏛️ 一、组织架构与职责质量体系明确组织内各部门、岗位的职责与权限，形成层级清晰的管理网络&#xf…...

编程新知 2025/7/7 12:15:03

基于Docker Compose部署Java微服务项目

一. 创建根项目根项目（父项目）主要用于依赖管理一些需要注意的点： 打包方式需要为 pom<modules>里需要注册子模块不要引入maven的打包插件，否则打包时会出问题 <?xml version"1.0" encoding"UTF-8…...

编程新知 2025/7/6 4:47:48

Java编程之桥接模式

定义桥接模式（Bridge Pattern）属于结构型设计模式，它的核心意图是将抽象部分与实现部分分离，使它们可以独立地变化。这种模式通过组合关系来替代继承关系，从而降低了抽象和实现这两个可变维度之间的耦合度。用例子…...

编程新知 2025/6/17 3:19:01

RabbitMQ入门4.1.0版本（基于java、SpringBoot操作）

RabbitMQ 一、RabbitMQ概述 RabbitMQ RabbitMQ最初由LShift和CohesiveFT于2007年开发，后来由Pivotal Software Inc.（现为VMware子公司）接管。RabbitMQ 是一个开源的消息代理和队列服务器，用 Erlang 语言编写。广泛应用于各种分布…...

编程新知 2025/7/7 5:34:17

接口自动化测试：HttpRunner基础

相关文档 HttpRunner V3.x中文文档 HttpRunner 用户指南使用HttpRunner 3.x实现接口自动化测试 HttpRunner介绍 HttpRunner 是一个开源的 API 测试工具，支持 HTTP(S)/HTTP2/WebSocket/RPC 等网络协议，涵盖接口测试、性能测试、数字体验监测等测试类型…...

编程新知 2025/7/7 14:20:35

[大语言模型]在个人电脑上部署ollama 并进行管理,最后配置AI程序开发助手.

ollama官网: 下载 https://ollama.com/ 安装查看可以使用的模型 https://ollama.com/search 例如 https://ollama.com/library/deepseek-r1/tags # deepseek-r1:7bollama pull deepseek-r1:7b改token数量为409622 16384 ollama命令说明 ollama serve #&#xff1a…...

编程新知 2025/7/6 0:01:34

基于PHP的连锁酒店管理系统

有需要请加文章底部Q哦可远程调试基于PHP的连锁酒店管理系统一介绍连锁酒店管理系统基于原生PHP开发，数据库mysql，前端bootstrap。系统角色分为用户和管理员。技术栈 phpmysqlbootstrapphpstudyvscode 二功能用户 1 注册/登录/注销 2 个人中…...

编程新知 2025/7/7 0:24:14

Spring AI Chat Memory 实战指南：Local 与 JDBC 存储集成

一个面向 Java 开发者的 Sring-Ai 示例工程项目，该项目是一个 Spring AI 快速入门的样例工程项目，旨在通过一些小的案例展示 Spring AI 框架的核心功能和使用方法。项目采用模块化设计，每个模块都专注于特定的功能领域，便于学习和…...

编程新知 2025/6/20 11:58:47

适应性Java用于现代 API：REST、GraphQL 和事件驱动

在快速发展的软件开发领域，REST、GraphQL 和事件驱动架构等新的 API 标准对于构建可扩展、高效的系统至关重要。Java 在现代 API 方面以其在企业应用中的稳定性而闻名，不断适应这些现代范式的需求。随着不断发展的生态系统，Java 在现代 API 方…...

编程新知 2025/6/21 11:20:52

在树莓派上添加音频输入设备的几种方法

在树莓派上添加音频输入设备可以通过以下步骤完成，具体方法取决于设备类型（如USB麦克风、3.5mm接口麦克风或HDMI音频输入）。以下是详细指南： 1. 连接音频输入设备 USB麦克风/声卡：直接插入树莓派的USB接口。3.5mm麦克…...

编程新知 2025/7/7 3:04:13

《OpenCV》——dlib（人脸应用实例）

文章目录

dlib库

dlib库——人脸应用实例——表情识别

dlib库——人脸应用实例——疲劳检测

相关文章：

《OpenCV》——dlib（人脸应用实例）

以太网通讯

UDP学习笔记（一）为什么UDP需要先将数据转换为字节数组

数据分析/数据科学常见SQL题目：连续登录用户、留存率、最大观看人数

【Conda】Windows安装conda/Anaconda环境

olmOCR：高效精准的 PDF 文本提取工具

数字投屏叫号器-发射端python窗口定制

从零开始实现大语言模型（十四）：高阶训练技巧

Spring-framework源码编译

分布式系统的核心挑战与解决方案

fastjson漏洞

upload-labs详解（13-20）文件上传分析

HTML第四节

基于 LeNet 网络的 MNIST 数据集图像分类

win11编译llama_cpp_python cuda128 RTX30/40/50版本

Spring Boot静态资源访问顺序

电脑总显示串口正在被占用处理方法

工具介绍《HACKBAR V2》

Java算法语法学习美丽子集的数目 - 力扣 Map接口

Vue项目通过内嵌iframe访问另一个vue页面，获取token适配后端鉴权(以内嵌若依项目举例)

质量体系的重要

基于Docker Compose部署Java微服务项目

Java编程之桥接模式

RabbitMQ入门4.1.0版本（基于java、SpringBoot操作）

接口自动化测试：HttpRunner基础

[大语言模型]在个人电脑上部署ollama 并进行管理,最后配置AI程序开发助手.

基于PHP的连锁酒店管理系统

Spring AI Chat Memory 实战指南：Local 与 JDBC 存储集成

适应性Java用于现代 API：REST、GraphQL 和事件驱动

在树莓派上添加音频输入设备的几种方法