当前位置：首页 > news >正文

【深度学习实战—8】：基于MediaPipe的人脸检测

news 2026/2/10 11:00:34

✨博客主页：王乐予🎈
✨年轻人要：Living for the moment（活在当下）！💪
🏆推荐专栏：【图像处理】【千锤百炼Python】【深度学习】【排序算法】

😺一、MediaPipe概述

MediaPipe 是一款由 Google Research 开发并开源的多媒体机器学习模型应用框架。

MediaPipe目前支持的解决方案(Solution)及支持的平台如下图所示：
在这里插入图片描述

😺二、MediaPipe人脸检测概述

MediaPipe 人脸检测器可以检测图片或视频中的人脸。可以使用此任务在帧中定位人脸和面部特征。此任务使用可处理单张图片或连续图片流的机器学习 (ML) 模型。该任务会输出人脸位置以及以下面部关键点：左眼、右眼、鼻尖、嘴巴、左眼区域和右眼区域。

MediaPipe人脸检测所用模型是BlazeFace的变体，BlazeFace 是谷歌19年提出的一种针对移动 GPU 推断进行优化的轻量级且精确的人脸检测器。

BlazeFace: Sub-millisecond Neural Face Detection on Mobile GPUs

😺三、程序实现

import cv2
import mediapipe as mpmp_face_detection = mp.solutions.face_detection
face_detection = mp_face_detection.FaceDetection(min_detection_confidence=0.5, model_selection=1)cap = cv2.VideoCapture('../test.mp4')while cap.isOpened():success, image = cap.read()# Convert color space because MediaPipe requires images in RGB formatimage = cv2.cvtColor(cv2.flip(image, 1), cv2.COLOR_BGR2RGB)# Perform facial detectionresults = face_detection.process(image)# Convert back to BGR so that OpenCV can display imagesimage = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)# Draw detected facial bounding boxesif results.detections:for detection in results.detections:mp_drawing = mp.solutions.drawing_utilsmp_drawing.draw_detection(image, detection, mp_drawing.DrawingSpec(thickness=4, circle_radius=2, color=(48, 255, 159)))cv2.imshow('MediaPipe Face Detection', image)if cv2.waitKey(1) & 0xFF == ord('q'):breakcap.release()
cv2.destroyAllWindows()

😺四、检测结果

在这里插入图片描述

【深度学习实战—8】：基于MediaPipe的人脸检测

✨博客主页：王乐予🎈 ✨年轻人要：Living for the moment（活在当下）！💪 🏆推荐专栏：【图像处理】【千锤百炼Python】【深度学习】【排序算法】目录 😺一、Med…...

编程日记 2024/5/27 15:48:05

OSCP学习，布置你的Kali Linux

为什么要写这篇文章？ 我是一个OSCP学习者，以教促学。同时也能让各位入门的师傅们更好的了解OSCP这门课程。本人文笔不太好，如果有什么写的不对的地方，师傅们多多指正。参考资料： OSCP 考试电子书 Linux Basics for…...

编程日记 2024/5/27 15:47:03

PWA离线优先策略：提升用户体验的关键步骤

Progressive Web Apps (PWA) 的离线优先策略是通过Service Worker和Cache API实现的，它允许在没有网络连接时仍然可以访问网站的部分或全部内容。 2500G计算机入门到高级架构师开发资料超级大礼包免费送！ 1. 创建Service Worker注册文件（se…...

编程日记 2024/5/27 15:44:01

网页提示“非私密连接”是为什么?

网页提示“非私密连接”（英文提示可能是 "Your connection is not private" 或 "Your connection is not secure"）主要是因为浏览器无法验证你正试图访问的网站的SSL/TLS证书，或者是证书存在问题，从而无法建立…...

编程日记 2024/5/27 15:42:59

[自动驾驶技术]-8 Tesla自动驾驶方案之硬件（AI Day 2022）

特斯拉在AI Day 2022先介绍了AI编译器，后面又介绍了Dojo的硬件软件，软件部分和AI编译器有部分重叠，本文介绍还是延用AI Day的思路，分为三部分：AI编译和推理，Dojo硬件，Dojo软件。特斯拉车道检测…...

编程日记 2024/5/27 15:40:57

人力资源管理信息化系统如何支持企业开展管理诊断？

华恒智信人力资源顾问有限公司致力于帮助企业开展人力资源管理方面的各项提升改进工作，在长期的咨询工作中，最常听到企业提到的问题莫过于管理诊断方面的问题，事实上，很多企业在日常工作中，都意识到企业内部存在管理方…...

编程日记 2024/5/27 15:37:55

Cohere继Command-R+之后发布大模型Aya-23，性能超越 Gemma、Mistral 等，支持中文

前言近年来，多语言大模型（MLLM）发展迅速，但大多数模型的性能依然存在显著差距，尤其是在非英语语言方面表现不佳。为了推动多语言自然语言处理技术的发展，Cohere团队发布了新的多语言指令微调模型家族——…...

编程日记 2024/5/27 15:36:53

身为UI设计老鸟，不学点3D，好像要被潮流抛弃啦，卷起来吧。

当前3D原则在UI设计中运用的越来越多，在UI设计中，使用3D元素可以为界面带来以下几个价值： 增强视觉冲击力：3D元素可以通过立体感和逼真的效果，为界面增添视觉冲击力，使得设计更加生动、吸引人，并…...

编程日记 2024/5/27 15:35:52

【C语言】实现贪吃蛇--项目实践（超详细）

前言： 贪吃蛇游戏大家都玩过吧？这次我们要用C语言来亲手制作一个！这个项目不仅能让我们复习C语言的知识，还能了解游戏是怎么一步步做出来的。我们会一起完成蛇的移动、食物的生成，还有碰撞检测等有趣的部分。准备好了…...

编程日记 2024/5/27 15:32:48

Elasticsearch 分析器的高级用法一（同义词，高亮搜索）

Elasticsearch 分析器的高级用法一（同义词，高亮搜索） 同义词简介分析使用同义词案例高亮搜索高亮搜索策略unifiedplainvh 同义词简介在搜索场景中，同义词用来处理不同的查询词，有可能是想表达相同的搜索目标。例…...

编程日记 2024/5/27 15:31:48

Python 开心消消乐

💝💝💝欢迎莅临我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:「stormsha的主页」…...

编程日记 2024/5/27 15:29:46

mysql - 索引基本知识梳理

mysql索引基本知识梳理索引介绍官方介绍索引是帮助MySQL高效获取数据的数据结构, 原理为以空间换时间, mysql的索引采用的是B树的结构索引的优缺点优点： 提高查询效率降低数据库IO成本通过索引对数据进行排序, 降低排序成本, 降低CPU消耗缺点&#xff1a…...

编程日记 2024/5/27 15:28:45

Nginx SSL/TLS配置：搭建安全的HTTPS网站

随着互联网安全性的日益提升，HTTPS已经成为网站安全通信的标配。Nginx作为一款高性能的HTTP和反向代理服务器，支持SSL/TLS协议，使得我们可以轻松地搭建安全的HTTPS网站。下面，我们将详细介绍如何在Nginx上配置SSL/TLS，…...

编程日记 2024/5/27 15:26:42

Redis数据类型（上篇）

前提：（key代表键） Redis常用的命令命令作用keys *查看当前库所有的keyexists key判断某个key是否存在type key查看key是什么类型del key 删除指定的keyunlink key非阻塞删除，仅仅将keys从keyspace元数据中删除，真正的…...

编程日记 2024/5/27 15:21:37

1.下载Linux的ISO镜像文件阿里镜像源网站: https://developer.aliyun.com/mirror/ 清华大学镜像源网站: https://mirrors.tuna.tsinghua.edu.cn/本人选择的是：Centos7.9.2009标准版 https://mirrors.tuna.tsinghua.edu.cn/centos/7.9.2009/isos/x86_64/ 标准版&a…...

编程日记 2024/5/27 15:20:36

slurm是什么，怎么用？ For slurm和For Pytorch有什么区别和联系？

1.slurm是什么？ Slurm（Simple Linux Utility for Resource Management）是一种开源的、用于集群和超级计算机的作业调度系统。它主要用于管理和调度大规模计算任务，使得用户可以有效地利用集群中的计算资源。Slurm提供了一套功能强…...

编程日记 2024/5/27 15:19:35

类和对象【六】友元和内部类

文章目录友元友元的作用友元的缺点友元函数语法：特点： 友元类语法：特点： 内部类概念特点友元友元的作用友元提供了一种打破封装的方式，有时提供了便利。友元的主要作用就是打破封装即可以让一个类的友元函数…...

编程日记 2024/5/27 15:18:33

一点点 cv 经验 1：cv方向、模型评估、输入尺寸、目标检测器设计

一点点 cv 经验 1：cv方向、模型评估、输入尺寸、目标检测器设计 cv 方向Pytorch数据集划分模型评估误差偏差方差噪声输入尺寸方法一：让数据适应模型方法二：修改模型适应数据方法三：划分Patch，分别处理目标检测器结构…...

编程日记 2024/5/27 15:17:32

visual studio 2022更改主题为深色

visual studio 2022更改主题为深色点击visual studio 上方的工具-> 选项在选项窗口中，选择环境 -> 常规 ，将其中的颜色主题改成深色点击确定，更改完成...

编程新知 2026/1/25 11:13:37

基于数字孪生的水厂可视化平台建设：架构与实践

分享大纲： 1、数字孪生水厂可视化平台建设背景 2、数字孪生水厂可视化平台建设架构 3、数字孪生水厂可视化平台建设成效近几年，数字孪生水厂的建设开展的如火如荼。作为提升水厂管理效率、优化资源的调度手段，基于数字孪生的水厂可视化平台的…...

编程新知 2025/12/23 17:14:55

论文浅尝 | 基于判别指令微调生成式大语言模型的知识图谱补全方法（ISWC2024）

笔记整理：刘治强，浙江大学硕士生，研究方向为知识图谱表示学习，大语言模型论文链接：http://arxiv.org/abs/2407.16127 发表会议：ISWC 2024 1. 动机传统的知识图谱补全（KGC）模型通过…...

编程新知 2026/1/31 12:03:23

【开发技术】.Net使用FFmpeg视频特定帧上绘制内容

目录一、目的二、解决方案 2.1 什么是FFmpeg 2.2 FFmpeg主要功能 2.3 使用Xabe.FFmpeg调用FFmpeg功能 2.4 使用 FFmpeg 的 drawbox 滤镜来绘制 ROI 三、总结一、目的当前市场上有很多目标检测智能识别的相关算法，当前调用一个医疗行业的AI识别算法后返回…...

编程新知 2026/2/9 17:11:06

uniapp 开发ios， xcode 提交app store connect 和 testflight内测

uniapp 中配置配置manifest 文档：manifest.json 应用配置 | uni-app官网 hbuilderx中本地打包下载IOS最新SDK 开发环境 | uni小程序SDK hbulderx 版本号：4.66 对应的sdk版本 4.66 两者必须一致本地打包的资源导入到SDK 导入资源 | uni小程序SDK …...

编程新知 2026/1/31 8:35:07