当前位置: 首页 > article >正文

使用OpenCV 和 Dlib 进行卷积神经网络人脸检测

文章目录

  • 引言
  • 1.准备工作
  • 2.代码解析
    • 2.1 导入必要的库
    • 2.2 加载CNN人脸检测模型
    • 2.3 加载并预处理图像
    • 2.4 进行人脸检测
    • 2.5 绘制检测结果
    • 2.6 显示结果
  • 3.完整代码
  • 4.性能考虑
  • 5.总结

引言

人脸检测是计算机视觉中最基础也最重要的任务之一。今天我将分享如何使用dlib库中的CNN人脸检测器和OpenCV来实现一个简单但高效的人脸检测程序。

1.准备工作

首先,我们需要安装必要的Python库:

pip install dlib opencv-python

此外,你还需要下载dlib提供的CNN人脸检测模型文件"mmod_human_face_detector.dat",可以从下面链接中获取。

  • mmod_human_face_detector.dat

2.代码解析

让我们逐步分析这个人脸检测程序的每个部分:

2.1 导入必要的库

import dlib
import cv2
  • dlib:一个强大的机器学习库,包含优秀的人脸检测和识别算法
  • cv2:OpenCV库,用于图像处理和显示

2.2 加载CNN人脸检测模型

cnn_face_detector = dlib.cnn_face_detection_model_v1("mmod_human_face_detector.dat")

这里我们使用dlib提供的CNN人脸检测器,它基于Max-Margin Object Detection (MMOD)算法,相比传统的HOG特征方法,CNN方法在复杂场景下表现更好。

2.3 加载并预处理图像

img = cv2.imread("hezhao.jpg")
img = cv2.resize(img,dsize=None,fx=0.5,fy=0.5)
  • 使用OpenCV读取图像文件
  • 将图像尺寸缩小一半,加快处理速度(可根据需要调整缩放比例)

2.4 进行人脸检测

faces = cnn_face_detector(img,0) # 检测人脸

调用CNN人脸检测器,返回检测到的人脸列表。参数0表示不进行上采样,保持原图尺寸检测。

2.5 绘制检测结果

for d in faces:# 计算每个人脸的位置rect = d.rectleft = rect.left()top = rect.top()right = rect.right()bottom = rect.bottom()# 绘制人脸对应的矩形框cv2.rectangle(img,(left,top),(right,bottom),(0,255,0),3)

遍历所有检测到的人脸,获取其边界框坐标,并用绿色矩形框标记出来。

2.6 显示结果

cv2.imshow("result",img)
k = cv2.waitKey()
cv2.destroyAllWindows()

使用OpenCV显示处理后的图像,等待用户按键后关闭窗口。

显示结果如下所示:
在这里插入图片描述

3.完整代码

import dlib
import cv2
cnn_face_detector = dlib.cnn_face_detection_model_v1("mmod_human_face_detector.dat")
img = cv2.imread("hezhao.jpg")
img = cv2.resize(img,dsize=None,fx=0.5,fy=0.5)faces = cnn_face_detector(img,0) # 检测人脸for d in faces:# 计算每个人脸的位置rect = d.rectleft = rect.left()top = rect.top()right = rect.right()bottom = rect.bottom()# 绘制人脸对应的矩形框cv2.rectangle(img,(left,top),(right,bottom),(0,255,0),3)
cv2.imshow("result",img)
k = cv2.waitKey()
cv2.destroyAllWindows()

4.性能考虑

  1. 模型选择:dlib提供了两种人脸检测器 - HOG(histogram of oriented gradients)和CNN。CNN模型更准确但计算量更大。

  2. 图像缩放:对大尺寸图像进行适当缩小可以显著提高处理速度。

  3. 硬件加速:如果有GPU支持,CNN模型可以运行得更快。

5.总结

通过这个简单的示例,我们展示了如何使用dlib和OpenCV实现一个有效的人脸检测系统。虽然代码只有不到20行,但它包含了计算机视觉中人脸检测的核心流程。你可以基于此代码进一步开发更复杂的人脸相关应用。

慢也好,步子小也好,往前走就好,只要我们一步步前进,都为时不晚。加油!
🚀🚀🚀

相关文章:

使用OpenCV 和 Dlib 进行卷积神经网络人脸检测

文章目录 引言1.准备工作2.代码解析2.1 导入必要的库2.2 加载CNN人脸检测模型2.3 加载并预处理图像2.4 进行人脸检测2.5 绘制检测结果2.6 显示结果 3.完整代码4.性能考虑5.总结 引言 人脸检测是计算机视觉中最基础也最重要的任务之一。今天我将分享如何使用dlib库中的CNN人脸检…...

React 实现 JWT 登录验证的最小可运行示例

下面是一个用 React 实现 JWT 登录验证的最小可运行示例,包含: React 前端:登录、保存 Token、获取用户数据。模拟后端:用 mock API(你也可以接真后端)。 🧱 技术栈 React(使用 Vi…...

Power Query精通指南1:查询结构设计、数据类型、数据导入与迁移(平面文件、Excel、Web)

文章目录 零、Power Query简介0.1 Power Query 主要功能0.2 Power Query 的优势0.3 Power Query 组件 一、Power Query数据处理基本流程1.1 前期准备1.2 提取1.3 转换1.3.1 Power Query 编辑器界面1.3.2 默认转换1.3.3 自定义转换 1.4 加载1.4.1 自动检测数据类型1.4.2 重命名查…...

vue2开发者sass预处理注意

vue2开发者sass预处理注意 sass的预处理器,早年使用node-sass,也就是vue2最初默认的编译器。 sass官方推出了dart-sass来替代。 node-sass已经停维很久了。 vue3默认使用的是dart-sass。 Uniapp的官方文档截图 从 HBuilderX 4.56 ,vue2 …...

淘宝按图搜索商品(拍立淘)Java 爬虫实战指南

在电商领域,按图搜索商品功能为用户提供了更直观、便捷的购物体验。淘宝的拍立淘功能更是凭借其强大的图像识别技术,成为许多开发者和商家关注的焦点。本文将详细介绍如何利用 Java 爬虫技术实现淘宝按图搜索商品功能,包括注册账号、上传图片…...

安卓基础(封装引用)

​​情况 1:普通 Java 项目(非 Android)​​ src/ ├── com/ │ ├── example/ │ │ ├── utils/ │ │ │ └── A.java // 工具类 A │ │ └── main/ │ │ └── B.java // 主类 B ​​A…...

深入理解 Docker 网络原理:构建高效、灵活的容器网络

在现代软件开发中,Docker 已经成为了容器化技术的代名词,广泛应用于开发、测试和生产环境。Docker 使得开发者能够将应用及其依赖打包成一个轻量级的容器,并通过 Docker 容器化技术来实现高效的部署与管理。 然而,在日常使用 Dock…...

使用 Selenium 爬取动态网页数据 —— 实战与坑点详解

本文记录了笔者在爬取网页数据过程中遇到的各种技术挑战,包括页面动态渲染、JavaScript 注入等问题,并最终给出一个可运行的完整方案。 文章目录 网页获取不到数据🚀 尝试用 Selenium 渲染页面 网页获取不到数据 某网页数据依赖大量 JavaSc…...

React 笔记[1] hello world

React 笔记[1] hello world 明白了!既然你已经安装了 Node.js,我们可以 从零开始搭建一个 React Tailwind CSS 的 Hello World 项目。我将一步步列出操作指令,你只需要在终端里依次执行。 ✅ 第一步:初始化项目 mkdir my-hello…...

Verilog Test Fixture 时钟激励

1、占空比50%时钟产生 always begin<clock> 1b0 ;#<PERIOD/2> ;<clock> 1b1 ;#<PERIOD/2> ; end reg <clock> 1b0 ;alwaysbegin#<PERIOD/2> ;<clock> ~<clock> ;end 2…...

守护数字家园:个人博客安全防护指南

前言 在之前的文章《WordPress个人博客搭建&#xff08;一&#xff09;》《WordPress个人博客搭建&#xff08;二&#xff09;》《WordPress个人博客搭建&#xff08;三&#xff09;》中&#xff0c;我们已经在非凡云云服务器上&#xff0c;借助1Panel搭建起属于自己的数字庭院…...

【网络编程】三、TCP网络套接字编程

文章目录 TCP通信流程Ⅰ. 服务器日志类实现Ⅱ. TCP服务端1、服务器创建流程2、创建套接字 -- socket3、绑定服务器 -- bind&#x1f38f;4、服务器监听 -- listen&#x1f38f;5、获取客户端连接请求 -- acceptaccept函数返回的套接字描述符是什么&#xff0c;不是已经有一个了…...

trae ai编程工具

Trae&#xff0c;致力于成为真正的 AI 工程师&#xff08;The Real Al Engineer&#xff09;。Trae 旗下的 AI IDE 产品&#xff0c;以智能生产力为核心&#xff0c;无缝融入你的开发流程&#xff0c;与你默契配合&#xff0c;更高质量、高效率完成每一个任务。 版本差异 国内…...

STM32系统定时器以及微秒延时函数分析

在CubeMX生成的工程中系统时钟节拍配置的函数为&#xff1a; __weak HAL_StatusTypeDef HAL_InitTick(uint32_t TickPriority) {HAL_StatusTypeDef status HAL_OK;/* Check uwTickFreq for MisraC 2012 (even if uwTickFreq is a enum type that doesnt take the value zero)…...

神经网络发展历程——积跬步至千里

神经网络类型层线性or非线性创新问题备注感知器单层线性模型&#xff0c;输出 1 1 1&#xff0c; − 1 -1 −1误差反馈学习阈值函数不可导&#xff0c;构造学习规则与感知器准则等价线性神经元单层线性模型梯度下降法训练参数线性函数&#xff0c;多层仍是线性变换本质上是最小…...

Java 24:重构数字信任边界 —— 后量子时代的智能安全防御体系构建

引言 在量子计算阴影与 AI 驱动攻击交织的网络安全新纪元&#xff0c;Java 平台正经历着自诞生以来最深刻的安全架构革新。作为企业级应用的核心基础设施&#xff0c;Java 24 不仅延续了 “一次编写&#xff0c;处处运行” 的跨平台基因&#xff0c;更以后量子密码学引擎、动态…...

荣耀A8互动娱乐组件部署实录(第2部分:界面逻辑与资源加载机制)

作者&#xff1a;从 Spine 骨骼动画里抠图三小时没睡的美术兼前端苦工 一、界面整体架构拆解 荣耀A8组件采用的是典型的分模块 UI 架构&#xff0c;即&#xff1a;主界面为入口容器&#xff0c;不同子页面&#xff08;如商城、银行、客服、游戏入口&#xff09;以逻辑功能划分…...

mac 使用 Docker 安装向量数据库Milvus独立版的保姆级别教程

Milvus 特点&#xff1a;开源的云原生向量数据库&#xff0c;支持多种索引类型和GPU加速&#xff0c;能够在亿级向量规模下实现低延迟高吞吐。具有灵活的部署选项和强大的社区支持。 适用场景&#xff1a;适合处理超大规模数据和高性能需求的应用&#xff0c;如图像搜索、推荐…...

技术视界 | 青龙机器人训练地形详解(一):如何创建一个地形

机器人强化学习中的地形训练是利用强化学习算法让机器人在不同地形环境中通过试错学习最优行为策略的过程&#xff0c;通过环境建模、策略学习与优化等环节&#xff0c;使机器人能够自主适应复杂多变的地形&#xff0c;提高其移动效率、稳定性和自主性&#xff0c;减少人为干预…...

网络安全系列--《文章1:网络安全基础与核心概念》

课程1&#xff1a;网络安全基础与核心概念 学习内容 1. 网络安全定义 网络安全是通过技术、管理及法律手段保护网络系统的硬件、软件及数据&#xff0c;使其免受破坏、篡改或泄露&#xff0c;确保系统稳定运行并提供可靠服务。其核心目标包括保密性、完整性、可用性、可控性及…...

2025-05-04 Unity 网络基础6——TCP心跳消息

文章目录 1 Disconnect 方法2 心跳消息 ​ 在客户端主动退出时&#xff0c;我们会调用 socket 的 ShutDown() 和 Close() 方法&#xff0c;但调用这两个方法后&#xff0c;服务器端无法得知客户端已经主动断开。 ​ 本文主要介绍在网络通信中&#xff0c;如何服务端如何判断客…...

word导出pdf带有目录导航栏-error记

1、打开word文档——>点击"视图"选项卡——>勾选"导航窗格" 2、点击"文件"——>导出——>创建PDF/XPS 3、点击"选项"——>勾选"创建书签时使用(C)" "标题(H)" 4、点击"确定"——>点击…...

1. 视频基础知识

1. 图像基础概念 像素&#xff1a;像素是一个图片的基本单位&#xff0c;pix是英语单词picture&#xff0c;加上英语单词“元素element”&#xff0c;就得到了pixel&#xff0c;简称px。所以“像素”有“图像元素”之意。分辨率&#xff1a;指的是图像的大小或者尺寸。比如 19…...

VTK 数据结构和算法类介绍

基本数据结构类 vtkPolyData 描述: 表示多边形几何结构 主要属性: Points: vtkPoints对象,存储顶点坐标 Verts: vtkCellArray对象,存储顶点数据 Lines: vtkCellArray对象,存储线数据 Polys: vtkCellArray对象,存储多边形数据 Strips: vtkCellArray对象,存储三角带数据 常…...

云计算的基础概论

一、云计算基础概念 1. 云计算定义 • 英文&#xff1a;Cloud Computing • 定义&#xff1a;通过互联网&#xff08;Internet&#xff09;按需提供可扩展的计算资源&#xff08;如服务器、存储、数据库、网络、软件等&#xff09;&#xff0c;用户无需管理底层基础设施。 …...

HarmonyOS-hdc远程网络方式连接设备

hdc工具使用手册 1 hdc简介 hdc&#xff08;OpenHarmony Device Connector&#xff09;是为开发人员提供的用于设备连接调试的命令行工具&#xff0c;pc端开发机使用命令行工具hdc&#xff0c;该工具需支持部署在Windows/Linux/Mac等系统上与OpenHarmony设备&#xff08;或模…...

【计算机网络网络层深度解析】从IP协议到路由优化

目录 前言技术背景与价值当前技术痛点解决方案概述目标读者说明 一、技术原理剖析核心概念图解核心作用讲解关键技术模块说明技术选型对比 二、实战演示环境配置要求核心实验实现实验1&#xff1a;IPv6地址配置实验2&#xff1a;OSPF路由配置实验3&#xff1a;NAT转换验证 运行…...

不同OS版本中的同一yum源yum list差异排查思路

问题描述&#xff1a; qemu-guest-agent二进制rpm包的yum仓库源和yum源仓库配置文件path_to_yum_conf&#xff0c; 通过yum list --available -c path_to_yum_conf 查询时&#xff0c;不同的OS版本出现了不同的结果 anolis-8无法识别 centos8可以识别 说明&#xff1a; 1 测试…...

奥威BI:AI+BI深度融合,重塑智能AI数据分析新标杆

在数字化浪潮席卷全球的今天&#xff0c;企业正面临着前所未有的数据挑战与机遇。如何高效、精准地挖掘数据价值&#xff0c;已成为推动业务增长、提升竞争力的核心议题。奥威BI&#xff0c;作为智能AI数据分析领域的领军者&#xff0c;凭借其创新的AIBI融合模式&#xff0c;正…...

第三节第一部分:Static修饰类变量、成员变量

总结 案例 要求 代码&#xff1a; User类&#xff1a; package com.day1_static;public class User {public static int num;public User() {User.num;} }Test类&#xff1a; package com.day1_static;public class Test {public static void main(String[] args) {User us…...