使用 Python 和 OpenCV 实现摄像头人脸检测并截图
概述
在现代应用中,人脸检测是一项非常重要的技术,广泛应用于安全监控、身份验证等领域。本文将详细介绍如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例来展示整个过程。
环境准备
在开始编写代码之前,确保已经安装了 OpenCV 库。可以使用以下命令安装:
pip install opencv-python
代码详解
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time# 调用摄像头检测人脸并截图
def camera(window_name, path_name):# Linux 不显示图形界面cv2.namedWindow(window_name)# 视频来源,来自USB摄像头cap = cv2.VideoCapture(0)# 告诉OpenCV使用人脸识别分类器classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")# 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组color = (0, 255, 0)num = 0while cap.isOpened():ok, frame = cap.read() # 读取一帧数据if not ok:break# 将当前桢图像转换成灰度图像grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))if len(faceRects) > 0: # 大于0则检测到人脸for faceRect in faceRects: # 单独框出每一张人脸x, y, w, h = faceRectnum = num + 1# 将当前帧保存为图片img_name = "%s/%d.jpg" % (path_name, num)image = frame[y - 10: y + h + 10, x - 10: x + w + 10]cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])# 延迟 60s,不要太频繁的发送,知道来了就可以了# time.sleep(60)# 画出矩形框cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)# 显示当前捕捉到了多少人脸图片了font = cv2.FONT_HERSHEY_SIMPLEXcv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)# 显示图像 Linux 下注释掉即可cv2.imshow(window_name, frame)c = cv2.waitKey(10)if c & 0xFF == ord('q'):break# 释放摄像头并销毁所有窗口cap.release()cv2.destroyAllWindows()if __name__ == '__main__':camera("watchdog", os.getcwd()+"/face")
代码解析
1. 导入必要的模块
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
# -*- coding: utf-8 -*-:指定文件编码为 UTF-8。import cv2:导入 OpenCV 库,用于图像处理和人脸检测。import os:导入 os 模块,用于文件路径操作。import time:导入 time 模块,用于延迟操作。
2. 定义 camera 函数
def camera(window_name, path_name):
def camera(window_name, path_name)::定义一个名为camera的函数,参数window_name是窗口名称,path_name是保存截图的路径。
3. 创建窗口
# Linux 不显示图形界面cv2.namedWindow(window_name)
cv2.namedWindow(window_name):创建一个窗口,用于显示视频流。在 Linux 下可以注释掉这行代码以不显示图形界面。
4. 打开摄像头
# 视频来源,来自USB摄像头cap = cv2.VideoCapture(0)
cv2.VideoCapture(0):打开默认摄像头。参数 0 表示默认摄像头。
5. 加载人脸识别分类器
# 告诉OpenCV使用人脸识别分类器classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")
cv2.CascadeClassifier(...):加载预训练的 Haar 级联分类器,用于检测人脸。os.getcwd()+"/haarcascade_frontalface_alt.xml":指定分类器文件的路径。
6. 设置边框颜色
# 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组color = (0, 255, 0)
color = (0, 255, 0):定义边框颜色为绿色。
7. 主循环
num = 0while cap.isOpened():ok, frame = cap.read() # 读取一帧数据if not ok:break# 将当前桢图像转换成灰度图像grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))if len(faceRects) > 0: # 大于0则检测到人脸for faceRect in faceRects: # 单独框出每一张人脸x, y, w, h = faceRectnum = num + 1# 将当前帧保存为图片img_name = "%s/%d.jpg" % (path_name, num)image = frame[y - 10: y + h + 10, x - 10: x + w + 10]cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])# 延迟 60s,不要太频繁的发送,知道来了就可以了# time.sleep(60)# 画出矩形框cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)# 显示当前捕捉到了多少人脸图片了font = cv2.FONT_HERSHEY_SIMPLEXcv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)# 显示图像 Linux 下注释掉即可cv2.imshow(window_name, frame)c = cv2.waitKey(10)if c & 0xFF == ord('q'):break
num = 0:初始化计数器。while cap.isOpened()::进入无限循环,实时读取摄像头图像。ok, frame = cap.read():从摄像头读取一帧图像。if not ok::检查读取是否成功,如果失败则退出循环。grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY):将图像转换为灰度图像。faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32)):检测图像中的人脸。if len(faceRects) > 0::检查是否检测到人脸。for faceRect in faceRects::遍历检测到的每个人脸。x, y, w, h = faceRect:获取人脸的位置和大小。num = num + 1:增加计数器。img_name = "%s/%d.jpg" % (path_name, num):生成保存图像的文件名。image = frame[y - 10: y + h + 10, x - 10: x + w + 10]:裁剪人脸区域并扩大边界。cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9]):保存图像。cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2):在图像上绘制矩形框。font = cv2.FONT_HERSHEY_SIMPLEX:设置字体样式。cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4):在图像上显示当前捕捉到的人脸数量。cv2.imshow(window_name, frame):显示带有矩形标记的图像。c = cv2.waitKey(10):等待 10 毫秒,等待用户按键。if c & 0xFF == ord('q')::按 ‘q’ 键退出循环。
8. 释放资源
# 释放摄像头并销毁所有窗口cap.release()cv2.destroyAllWindows()
cap.release():释放摄像头资源。cv2.destroyAllWindows():关闭所有 OpenCV 窗口。
9. 主程序入口
if __name__ == '__main__':camera("watchdog", os.getcwd()+"/face")
if __name__ == '__main__'::检查是否直接运行此脚本。camera("watchdog", os.getcwd()+"/face"):调用camera函数,传入窗口名称和保存截图的路径。
完整代码
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
# 调用摄像头检测人脸并截图
def camera(window_name, path_name):# Linux 不显示图形界面cv2.namedWindow(window_name)# 视频来源,来自USB摄像头cap = cv2.VideoCapture(0)# 告诉OpenCV使用人脸识别分类器classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")# 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组color = (0, 255, 0)num = 0while cap.isOpened():ok, frame = cap.read() # 读取一帧数据if not ok:break# 将当前桢图像转换成灰度图像grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))if len(faceRects) > 0: # 大于0则检测到人脸for faceRect in faceRects: # 单独框出每一张人脸x, y, w, h = faceRectnum = num+1# 将当前帧保存为图片img_name = "%s/%d.jpg" % (path_name, num)image = frame[y - 10: y + h + 10, x - 10: x + w + 10]cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])# 延迟 60s,不要太频繁的发送,知道来了就可以了# time.sleep(60)# 画出矩形框cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)# 显示当前捕捉到了多少人脸图片了font = cv2.FONT_HERSHEY_SIMPLEXcv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)# 显示图像 Linux 下注释掉即可cv2.imshow(window_name, frame)c = cv2.waitKey(10)if c & 0xFF == ord('q'):break# 释放摄像头并销毁所有窗口cap.release()cv2.destroyAllWindows()if __name__ == '__main__':camera("watchdog", os.getcwd()+"/face")
测试
-
确保你的摄像头正常工作。
-
运行脚本:
python3 face_detection.py -
打开摄像头后,你会看到一个窗口显示实时视频流,并且在检测到的人脸周围绘制绿色矩形。
-
按 ‘q’ 键退出程序。
总结
本文详细介绍了如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例展示了整个过程。通过使用 cv2.VideoCapture 打开摄像头,cv2.CascadeClassifier 加载预训练的 Haar 级联分类器,cv2.cvtColor 转换图像颜色空间,cv2.rectangle 绘制矩形,cv2.imwrite 保存图像,最终实现了在实时视频流中检测并保存人脸图像的功能。
相关文章:
使用 Python 和 OpenCV 实现摄像头人脸检测并截图
概述 在现代应用中,人脸检测是一项非常重要的技术,广泛应用于安全监控、身份验证等领域。本文将详细介绍如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例来展示整个过程。 环境准备 在开始编写代码之前&#…...
【二叉搜素树】——LeetCode二叉树问题集锦:6个实用题目和解题思路
文章目录 计算布尔二叉树的值求根节点到叶节点的数字之和二叉树剪枝验证二叉搜索树二叉搜索树中第K小的元素二叉树的所有路径 计算布尔二叉树的值 解题思路: 这是一个二叉树的布尔评估问题。树的每个节点包含一个值,其中叶子节点值为 0 或 1࿰…...
【计算机视觉】FusionGAN
1. FusionGAN论文阅读 abreheret/FusionGAN: Pytorch implementation of "Generating a Fusion Image: One’s Identity and Another’s Shape" 1.1. WHY 在现实世界中,将对象或人物转换为期望的形状是一种常用技术,但现有的图像翻译方法在处理身份和形状时存在…...
问:SQL优化,七条实践总结?
SQL语句优化是数据库性能调优的重要部分,通过合理的优化可以显著提升查询速度和系统性能。文章总结几种常见SQL语句优化方法。 1. 优化Where子句的顺序 原则:表之间的连接条件应写在其他Where条件之前,能够过滤掉最大数量记录的条件应优先写…...
unity单例模式的不同声明(待完善
总结: 这段代码实现了一个泛型单例模式(Singleton Pattern),用于确保某个类(由泛型参数 T 指定)在整个应用程序中只有一个实例,并且在第一次访问时才创建该实例。该模式保证了该实例的全局唯一…...
大模型在蓝鲸运维体系应用——蓝鲸运维开发智能助手
本文来自腾讯蓝鲸智云社区用户: CanWay 背景 1、运维转型背景 蓝鲸平台从诞生之初,就一直在不遗余力地推动运维转型,让运维团队可以通过一体化PaaS平台,快速编写脚本,编排流程,开发运维工具,从被动地提供…...
vue2,vue3响应式的理解
vue2的话主要使用的是defineProperty对已有属性添加get,set,从而完成对数据的响应式控制,但每次需要for循环对属性进行遍历 function DefineReactive(target, key, value) {//存在多层嵌套的objectObserver(value);Object.defineReactive(target, key, {get() {retu…...
群控系统服务端开发模式-应用开发-前端退出功能
我们从未登录一直到退出,现在已经登录到操作,现在完成退出。退出有两种情况下会退出:第一种情况下是手动点击退出按钮,第二种情况下是登录过期时间到了自动退出的。 一、手动退出 因退出及个人信息页面都在公有页面,所…...
Web入门
Spring 官网:Spring | Home Spring是一个开源的Java企业级应用开发框架。Spring的主要目的是使Java EE(Java Platform, Enterprise Edition)开发更容易,并且通过提供一系列丰富的库和接口来促进良好编程实践,是…...
基于SpringBoot网上超市的设计与实现录像
基于SpringBoot网上超市的设计与实现录像 SpringBoot网上超市的设计与实现录像...
python爬虫(二)爬取国家博物馆的信息
import requests from bs4 import BeautifulSoup# 起始网址 url https://www.chnmuseum.cn/zx/xingnew/index_1.shtml # 用于存储所有数据 all_data [] page 1 global_index 1 # 定义全局序号变量并初始化为1 while True:html_url requests.get(url).textif requests.get…...
【mysql的当前读和快照读】
在MySQL中,尤其是InnoDB存储引擎中,读操作主要分为两种:当前读(Current Read)和快照读(Snapshot Read) 当前读 当前读每次读取的都是当前最新的数据。这种读操作在读取数据时不允许其他事务对这…...
[CKS] Audit Log Policy
最近准备花一周的时间准备CKS考试,在准备考试中发现有一个题目关于audit policy的题目。 专栏其他文章: [CKS] Create/Read/Mount a Secret in K8S-CSDN博客[CKS] Audit Log Policy-CSDN博客 -[CKS] 利用falco进行容器日志捕捉和安全监控-CSDN博客[CKS] K8S Netw…...
【Linux】-学习笔记03
第十一章-管理Linux软件包和进程 1.源码下载安装软件 1.1概念 源码文件:程序编写者使用C或C等语言编写的原始代码文本文件 源码文件使用.tar.gz或.tar.bz2打包成压缩文件 1.2特点 源码包可移植性好,与待安装软件的工作环境依赖性不大 由于有编译过程…...
Leetcode热题100-32 最长有效括号
Leetcode热题100-32 最长有效括号 1. 题目描述2. 解题思路动态规划栈解法 3. 代码实现动态规划栈解法 1. 题目描述 32 最长有效括号 2. 解题思路 动态规划 定义状态: 设 dp[i] 表示以位置 i 结尾的最长有效括号子串的长度。 状态转移方程: 遍历字符…...
【大数据学习 | HBASE】hbase的读数据流程与hbase读取数据
1. hbase的读数据流程 在解析读取流程之前我们还需要知道两个功能性的组件和HFIle的格式信息 HFILE 存储在hdfs中的hbase文件,这个文件中会存在hbase中的数据以kv类型显示,同时还会存在hbase的元数据信息,包括整个hfile文件的索引大小&…...
A027-基于Spring Boot的农事管理系统
🙊作者简介:在校研究生,拥有计算机专业的研究生开发团队,分享技术代码帮助学生学习,独立完成自己的网站项目。 代码可以查看文章末尾⬇️联系方式获取,记得注明来意哦~🌹 赠送计算机毕业设计600…...
Redisson的可重入锁
初始状态: 表示系统或资源在没有线程持有锁的情况下的状态,任何线程都可以尝试获取锁。 线程 1 获得锁: 线程 1 首次获取了锁并进入受保护的代码区域。 线程 1 再次请求锁: 在持有锁的情况下,线程 1 再次请求锁&a…...
SQL Server Service Broker完整示例
目录 准备 创建Message,Contract,Queue和Service 创建调用存储过程 启用SQL Agent并创建Job执行存储过程 调用demo 常见故障排除 准备 判断你的数据库YourDatabaseName是否启用了Service Broker SELECT is_broker_enabled FROM sys.databases WH…...
CentOS7 升级OpenSSH9.0全过程和坑
近日,漏洞肆虐,需要升级新版本,才能解决漏洞。故有此文: 0 查看当前版本 [root@host-testsvc openssh-9.0p1]# ssh -V OpenSSH_7.4p1, OpenSSL 1.0.2k-fips 26 Jan 20171、在data下新建一个独立目录openssh目录,用来存放软件 [root@host-testsvc data]# mkdir openssh…...
国防科技大学计算机基础课程笔记02信息编码
1.机内码和国标码 国标码就是我们非常熟悉的这个GB2312,但是因为都是16进制,因此这个了16进制的数据既可以翻译成为这个机器码,也可以翻译成为这个国标码,所以这个时候很容易会出现这个歧义的情况; 因此,我们的这个国…...
三维GIS开发cesium智慧地铁教程(5)Cesium相机控制
一、环境搭建 <script src"../cesium1.99/Build/Cesium/Cesium.js"></script> <link rel"stylesheet" href"../cesium1.99/Build/Cesium/Widgets/widgets.css"> 关键配置点: 路径验证:确保相对路径.…...
Linux相关概念和易错知识点(42)(TCP的连接管理、可靠性、面临复杂网络的处理)
目录 1.TCP的连接管理机制(1)三次握手①握手过程②对握手过程的理解 (2)四次挥手(3)握手和挥手的触发(4)状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...
基于Uniapp开发HarmonyOS 5.0旅游应用技术实践
一、技术选型背景 1.跨平台优势 Uniapp采用Vue.js框架,支持"一次开发,多端部署",可同步生成HarmonyOS、iOS、Android等多平台应用。 2.鸿蒙特性融合 HarmonyOS 5.0的分布式能力与原子化服务,为旅游应用带来…...
学校招生小程序源码介绍
基于ThinkPHPFastAdminUniApp开发的学校招生小程序源码,专为学校招生场景量身打造,功能实用且操作便捷。 从技术架构来看,ThinkPHP提供稳定可靠的后台服务,FastAdmin加速开发流程,UniApp则保障小程序在多端有良好的兼…...
Cloudflare 从 Nginx 到 Pingora:性能、效率与安全的全面升级
在互联网的快速发展中,高性能、高效率和高安全性的网络服务成为了各大互联网基础设施提供商的核心追求。Cloudflare 作为全球领先的互联网安全和基础设施公司,近期做出了一个重大技术决策:弃用长期使用的 Nginx,转而采用其内部开发…...
如何在网页里填写 PDF 表格?
有时候,你可能希望用户能在你的网站上填写 PDF 表单。然而,这件事并不简单,因为 PDF 并不是一种原生的网页格式。虽然浏览器可以显示 PDF 文件,但原生并不支持编辑或填写它们。更糟的是,如果你想收集表单数据ÿ…...
佰力博科技与您探讨热释电测量的几种方法
热释电的测量主要涉及热释电系数的测定,这是表征热释电材料性能的重要参数。热释电系数的测量方法主要包括静态法、动态法和积分电荷法。其中,积分电荷法最为常用,其原理是通过测量在电容器上积累的热释电电荷,从而确定热释电系数…...
CVE-2020-17519源码分析与漏洞复现(Flink 任意文件读取)
漏洞概览 漏洞名称:Apache Flink REST API 任意文件读取漏洞CVE编号:CVE-2020-17519CVSS评分:7.5影响版本:Apache Flink 1.11.0、1.11.1、1.11.2修复版本:≥ 1.11.3 或 ≥ 1.12.0漏洞类型:路径遍历&#x…...
免费PDF转图片工具
免费PDF转图片工具 一款简单易用的PDF转图片工具,可以将PDF文件快速转换为高质量PNG图片。无需安装复杂的软件,也不需要在线上传文件,保护您的隐私。 工具截图 主要特点 🚀 快速转换:本地转换,无需等待上…...
