当前位置: 首页 > news >正文

使用 Python 和 OpenCV 实现摄像头人脸检测并截图

概述

在现代应用中,人脸检测是一项非常重要的技术,广泛应用于安全监控、身份验证等领域。本文将详细介绍如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例来展示整个过程。

环境准备

在开始编写代码之前,确保已经安装了 OpenCV 库。可以使用以下命令安装:

pip install opencv-python
代码详解
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time# 调用摄像头检测人脸并截图
def camera(window_name, path_name):# Linux 不显示图形界面cv2.namedWindow(window_name)# 视频来源,来自USB摄像头cap = cv2.VideoCapture(0)# 告诉OpenCV使用人脸识别分类器classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")# 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组color = (0, 255, 0)num = 0while cap.isOpened():ok, frame = cap.read()  # 读取一帧数据if not ok:break# 将当前桢图像转换成灰度图像grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))if len(faceRects) > 0:  # 大于0则检测到人脸for faceRect in faceRects:  # 单独框出每一张人脸x, y, w, h = faceRectnum = num + 1# 将当前帧保存为图片img_name = "%s/%d.jpg" % (path_name, num)image = frame[y - 10: y + h + 10, x - 10: x + w + 10]cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])# 延迟 60s,不要太频繁的发送,知道来了就可以了# time.sleep(60)# 画出矩形框cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)# 显示当前捕捉到了多少人脸图片了font = cv2.FONT_HERSHEY_SIMPLEXcv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)# 显示图像 Linux 下注释掉即可cv2.imshow(window_name, frame)c = cv2.waitKey(10)if c & 0xFF == ord('q'):break# 释放摄像头并销毁所有窗口cap.release()cv2.destroyAllWindows()if __name__ == '__main__':camera("watchdog", os.getcwd()+"/face")
代码解析
1. 导入必要的模块
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
  • # -*- coding: utf-8 -*-:指定文件编码为 UTF-8。
  • import cv2:导入 OpenCV 库,用于图像处理和人脸检测。
  • import os:导入 os 模块,用于文件路径操作。
  • import time:导入 time 模块,用于延迟操作。
2. 定义 camera 函数
def camera(window_name, path_name):
  • def camera(window_name, path_name)::定义一个名为 camera 的函数,参数 window_name 是窗口名称,path_name 是保存截图的路径。
3. 创建窗口
    # Linux 不显示图形界面cv2.namedWindow(window_name)
  • cv2.namedWindow(window_name):创建一个窗口,用于显示视频流。在 Linux 下可以注释掉这行代码以不显示图形界面。
4. 打开摄像头
    # 视频来源,来自USB摄像头cap = cv2.VideoCapture(0)
  • cv2.VideoCapture(0):打开默认摄像头。参数 0 表示默认摄像头。
5. 加载人脸识别分类器
    # 告诉OpenCV使用人脸识别分类器classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")
  • cv2.CascadeClassifier(...):加载预训练的 Haar 级联分类器,用于检测人脸。
  • os.getcwd()+"/haarcascade_frontalface_alt.xml":指定分类器文件的路径。
6. 设置边框颜色
    # 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组color = (0, 255, 0)
  • color = (0, 255, 0):定义边框颜色为绿色。
7. 主循环
    num = 0while cap.isOpened():ok, frame = cap.read()  # 读取一帧数据if not ok:break# 将当前桢图像转换成灰度图像grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))if len(faceRects) > 0:  # 大于0则检测到人脸for faceRect in faceRects:  # 单独框出每一张人脸x, y, w, h = faceRectnum = num + 1# 将当前帧保存为图片img_name = "%s/%d.jpg" % (path_name, num)image = frame[y - 10: y + h + 10, x - 10: x + w + 10]cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])# 延迟 60s,不要太频繁的发送,知道来了就可以了# time.sleep(60)# 画出矩形框cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)# 显示当前捕捉到了多少人脸图片了font = cv2.FONT_HERSHEY_SIMPLEXcv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)# 显示图像 Linux 下注释掉即可cv2.imshow(window_name, frame)c = cv2.waitKey(10)if c & 0xFF == ord('q'):break
  • num = 0:初始化计数器。
  • while cap.isOpened()::进入无限循环,实时读取摄像头图像。
  • ok, frame = cap.read():从摄像头读取一帧图像。
  • if not ok::检查读取是否成功,如果失败则退出循环。
  • grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY):将图像转换为灰度图像。
  • faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32)):检测图像中的人脸。
  • if len(faceRects) > 0::检查是否检测到人脸。
  • for faceRect in faceRects::遍历检测到的每个人脸。
  • x, y, w, h = faceRect:获取人脸的位置和大小。
  • num = num + 1:增加计数器。
  • img_name = "%s/%d.jpg" % (path_name, num):生成保存图像的文件名。
  • image = frame[y - 10: y + h + 10, x - 10: x + w + 10]:裁剪人脸区域并扩大边界。
  • cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9]):保存图像。
  • cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2):在图像上绘制矩形框。
  • font = cv2.FONT_HERSHEY_SIMPLEX:设置字体样式。
  • cv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4):在图像上显示当前捕捉到的人脸数量。
  • cv2.imshow(window_name, frame):显示带有矩形标记的图像。
  • c = cv2.waitKey(10):等待 10 毫秒,等待用户按键。
  • if c & 0xFF == ord('q')::按 ‘q’ 键退出循环。
8. 释放资源
    # 释放摄像头并销毁所有窗口cap.release()cv2.destroyAllWindows()
  • cap.release():释放摄像头资源。
  • cv2.destroyAllWindows():关闭所有 OpenCV 窗口。
9. 主程序入口
if __name__ == '__main__':camera("watchdog", os.getcwd()+"/face")
  • if __name__ == '__main__'::检查是否直接运行此脚本。
  • camera("watchdog", os.getcwd()+"/face"):调用 camera 函数,传入窗口名称和保存截图的路径。
完整代码
# -*- coding: utf-8 -*-
# import 进openCV的库
import cv2
import os
import time
# 调用摄像头检测人脸并截图
def camera(window_name, path_name):# Linux 不显示图形界面cv2.namedWindow(window_name)# 视频来源,来自USB摄像头cap = cv2.VideoCapture(0)# 告诉OpenCV使用人脸识别分类器classfier = cv2.CascadeClassifier(os.getcwd()+"/haarcascade_frontalface_alt.xml")# 识别出人脸后要画的边框的颜色,RGB格式, color是一个不可增删的数组color = (0, 255, 0)num = 0while cap.isOpened():ok, frame = cap.read()  # 读取一帧数据if not ok:break# 将当前桢图像转换成灰度图像grey = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)# 人脸检测,1.2和2分别为图片缩放比例和需要检测的有效点数faceRects = classfier.detectMultiScale(grey, scaleFactor=1.2, minNeighbors=3, minSize=(32, 32))if len(faceRects) > 0:  # 大于0则检测到人脸for faceRect in faceRects:  # 单独框出每一张人脸x, y, w, h = faceRectnum = num+1# 将当前帧保存为图片img_name = "%s/%d.jpg" % (path_name, num)image = frame[y - 10: y + h + 10, x - 10: x + w + 10]cv2.imwrite(img_name, image, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])# 延迟 60s,不要太频繁的发送,知道来了就可以了# time.sleep(60)# 画出矩形框cv2.rectangle(frame, (x - 10, y - 10), (x + w + 10, y + h + 10), color, 2)# 显示当前捕捉到了多少人脸图片了font = cv2.FONT_HERSHEY_SIMPLEXcv2.putText(frame, 'num:%d/1000' % (num), (x + 30, y + 30), font, 1, (255, 0, 255), 4)# 显示图像 Linux 下注释掉即可cv2.imshow(window_name, frame)c = cv2.waitKey(10)if c & 0xFF == ord('q'):break# 释放摄像头并销毁所有窗口cap.release()cv2.destroyAllWindows()if __name__ == '__main__':camera("watchdog", os.getcwd()+"/face")
测试
  1. 确保你的摄像头正常工作。

  2. 运行脚本:

    python3 face_detection.py
    
  3. 打开摄像头后,你会看到一个窗口显示实时视频流,并且在检测到的人脸周围绘制绿色矩形。

  4. 按 ‘q’ 键退出程序。

总结

本文详细介绍了如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例展示了整个过程。通过使用 cv2.VideoCapture 打开摄像头,cv2.CascadeClassifier 加载预训练的 Haar 级联分类器,cv2.cvtColor 转换图像颜色空间,cv2.rectangle 绘制矩形,cv2.imwrite 保存图像,最终实现了在实时视频流中检测并保存人脸图像的功能。


相关文章:

使用 Python 和 OpenCV 实现摄像头人脸检测并截图

概述 在现代应用中,人脸检测是一项非常重要的技术,广泛应用于安全监控、身份验证等领域。本文将详细介绍如何使用 Python 和 OpenCV 库实现摄像头人脸检测并截图,并通过具体的代码示例来展示整个过程。 环境准备 在开始编写代码之前&#…...

【二叉搜素树】——LeetCode二叉树问题集锦:6个实用题目和解题思路

文章目录 计算布尔二叉树的值求根节点到叶节点的数字之和二叉树剪枝验证二叉搜索树二叉搜索树中第K小的元素二叉树的所有路径 计算布尔二叉树的值 解题思路: 这是一个二叉树的布尔评估问题。树的每个节点包含一个值,其中叶子节点值为 0 或 1&#xff0…...

【计算机视觉】FusionGAN

1. FusionGAN论文阅读 abreheret/FusionGAN: Pytorch implementation of "Generating a Fusion Image: One’s Identity and Another’s Shape" 1.1. WHY 在现实世界中,将对象或人物转换为期望的形状是一种常用技术,但现有的图像翻译方法在处理身份和形状时存在…...

问:SQL优化,七条实践总结?

SQL语句优化是数据库性能调优的重要部分,通过合理的优化可以显著提升查询速度和系统性能。文章总结几种常见SQL语句优化方法。 1. 优化Where子句的顺序 原则:表之间的连接条件应写在其他Where条件之前,能够过滤掉最大数量记录的条件应优先写…...

unity单例模式的不同声明(待完善

总结: 这段代码实现了一个泛型单例模式(Singleton Pattern),用于确保某个类(由泛型参数 T 指定)在整个应用程序中只有一个实例,并且在第一次访问时才创建该实例。该模式保证了该实例的全局唯一…...

大模型在蓝鲸运维体系应用——蓝鲸运维开发智能助手

本文来自腾讯蓝鲸智云社区用户: CanWay 背景 1、运维转型背景 蓝鲸平台从诞生之初,就一直在不遗余力地推动运维转型,让运维团队可以通过一体化PaaS平台,快速编写脚本,编排流程,开发运维工具,从被动地提供…...

vue2,vue3响应式的理解

vue2的话主要使用的是defineProperty对已有属性添加get,set,从而完成对数据的响应式控制,但每次需要for循环对属性进行遍历 function DefineReactive(target, key, value) {//存在多层嵌套的objectObserver(value);Object.defineReactive(target, key, {get() {retu…...

群控系统服务端开发模式-应用开发-前端退出功能

我们从未登录一直到退出,现在已经登录到操作,现在完成退出。退出有两种情况下会退出:第一种情况下是手动点击退出按钮,第二种情况下是登录过期时间到了自动退出的。 一、手动退出 因退出及个人信息页面都在公有页面,所…...

Web入门

Spring 官网:Spring | Home Spring是一个开源的Java企业级应用开发框架。Spring的主要目的是使Java EE(Java Platform, Enterprise Edition)开发更容易,并且通过提供一系列丰富的库和接口来促进良好编程实践,是…...

基于SpringBoot网上超市的设计与实现录像

基于SpringBoot网上超市的设计与实现录像 SpringBoot网上超市的设计与实现录像...

python爬虫(二)爬取国家博物馆的信息

import requests from bs4 import BeautifulSoup# 起始网址 url https://www.chnmuseum.cn/zx/xingnew/index_1.shtml # 用于存储所有数据 all_data [] page 1 global_index 1 # 定义全局序号变量并初始化为1 while True:html_url requests.get(url).textif requests.get…...

【mysql的当前读和快照读】

在MySQL中,尤其是InnoDB存储引擎中,读操作主要分为两种:当前读(Current Read)和快照读(Snapshot Read) 当前读 当前读每次读取的都是当前最新的数据。这种读操作在读取数据时不允许其他事务对这…...

[CKS] Audit Log Policy

最近准备花一周的时间准备CKS考试,在准备考试中发现有一个题目关于audit policy的题目。 ​ 专栏其他文章: [CKS] Create/Read/Mount a Secret in K8S-CSDN博客[CKS] Audit Log Policy-CSDN博客 -[CKS] 利用falco进行容器日志捕捉和安全监控-CSDN博客[CKS] K8S Netw…...

【Linux】-学习笔记03

第十一章-管理Linux软件包和进程 1.源码下载安装软件 1.1概念 源码文件:程序编写者使用C或C等语言编写的原始代码文本文件 源码文件使用.tar.gz或.tar.bz2打包成压缩文件 1.2特点 源码包可移植性好,与待安装软件的工作环境依赖性不大 由于有编译过程…...

Leetcode热题100-32 最长有效括号

Leetcode热题100-32 最长有效括号 1. 题目描述2. 解题思路动态规划栈解法 3. 代码实现动态规划栈解法 1. 题目描述 32 最长有效括号 2. 解题思路 动态规划 定义状态: 设 dp[i] 表示以位置 i 结尾的最长有效括号子串的长度。 状态转移方程: 遍历字符…...

【大数据学习 | HBASE】hbase的读数据流程与hbase读取数据

1. hbase的读数据流程 在解析读取流程之前我们还需要知道两个功能性的组件和HFIle的格式信息 HFILE 存储在hdfs中的hbase文件,这个文件中会存在hbase中的数据以kv类型显示,同时还会存在hbase的元数据信息,包括整个hfile文件的索引大小&…...

A027-基于Spring Boot的农事管理系统

🙊作者简介:在校研究生,拥有计算机专业的研究生开发团队,分享技术代码帮助学生学习,独立完成自己的网站项目。 代码可以查看文章末尾⬇️联系方式获取,记得注明来意哦~🌹 赠送计算机毕业设计600…...

Redisson的可重入锁

初始状态: 表示系统或资源在没有线程持有锁的情况下的状态,任何线程都可以尝试获取锁。 线程 1 获得锁: 线程 1 首次获取了锁并进入受保护的代码区域。 线程 1 再次请求锁: 在持有锁的情况下,线程 1 再次请求锁&a…...

SQL Server Service Broker完整示例

目录 准备 创建Message,Contract,Queue和Service 创建调用存储过程 启用SQL Agent并创建Job执行存储过程 调用demo 常见故障排除 准备 判断你的数据库YourDatabaseName是否启用了Service Broker SELECT is_broker_enabled FROM sys.databases WH…...

CentOS7 升级OpenSSH9.0全过程和坑

近日,漏洞肆虐,需要升级新版本,才能解决漏洞。故有此文: 0 查看当前版本 [root@host-testsvc openssh-9.0p1]# ssh -V OpenSSH_7.4p1, OpenSSL 1.0.2k-fips 26 Jan 20171、在data下新建一个独立目录openssh目录,用来存放软件 [root@host-testsvc data]# mkdir openssh…...

RSTP的配置

RSTP相对于STP在端口角色、端口状态、配置BPDU格式、配置BPDU的处理方式、快速收敛机制、拓扑变更机制和4种保护特性方面的详细改进说明: 端口角色: STP中定义了三种端口角色:根端口(Root Port)、指定端口&#xff0…...

力扣257:二叉树的所有路径

给你一个二叉树的根节点 root ,按 任意顺序 ,返回所有从根节点到叶子节点的路径。 叶子节点 是指没有子节点的节点。 示例 1: 输入:root [1,2,3,null,5] 输出:["1->2->5","1->3"]示例…...

Tcl 和 Python 在二次开发研究

引言 Tcl(Tool Command Language)和 Python 都是广泛应用于各种领域的编程语言,特别是在二次开发和自动化开发方面,两者有着独特的特性。Tcl 是一种动态的脚本语言,早期主要用于集成和控制其他程序,因此它经常出现在嵌入式应用和图形用户界面(GUI)开发中。而 Python 是…...

【NLP优化】Ubuntu 20.04 下 源码安装 CasADi + Ipopt / acados

20241114 记录一下 Ubuntu 20.04 下安装 MPC 中两种常用开源 NLP 优化器 CasADi + Ipopt / acados 可以新建一个文件夹,保存所有源码安装下载的代码 mkdir ~/mpc_dep1. 安装依赖 # **IPOPT** sudo apt-get install gcc g++ gfortran git patch wget pkg-config libmetis-de…...

[241110] 微软发布多智能体系统Magentic-One | 社区讨论:Ubuntu 26.04 LTS 发布前移除 Qt 5

目录 微软发布多智能体系统 Magentic-One社区讨论:Ubuntu 26.04 LTS 发布前移除 Qt 5 微软发布多智能体系统 Magentic-One 微软研究院近日发布了一个名为 Magentic-One 的多智能体系统,旨在解决复杂的现实世界任务。这个系统展现了令人兴奋的潜力&#…...

AI风向标|算力与通信的完美融合,SRM6690解锁端侧AI的智能密码

当前,5G技术已经成为推动数字经济和实体经济深度融合的关键驱动力,进入5G发展的下半场,5G与AI的融合正推动诸多行业的数字化转型和创新发展,终端侧AI和端云混合式AI将广泛应用于各类消费终端和各行各业。 在推动5G和AI与各行业场…...

MySQL查询执行(六):join查询

到底可不可以使用join 假设存在如下表结构: -- 创建表t2 CREATE TABLE t2 (id int(11) NOT NULL,a int(11) DEFAULT NULL,b int(11) DEFAULT NULL,PRIMARY KEY (id),KEY a (a) ) ENGINEInnoDB;-- 向t2写入1000条数据 drop procedure idata; delimiter ;; create pr…...

python习题练习

python习题 编写一个简单的工资管理程序系统可以管理以下四类人:工人(worker)、销售员(salesman)、经理(manager)、销售经理(salemanger)所有的员工都具有员工号,工资等属性,有设置姓名,获取姓名,获取员工号,计算工资等…...

MySQL高级(二):一条更新语句是如何执行的

执行步骤 1. 解析 SQL 语句 MySQL 首先会解析你输入的 UPDATE 语句。解析器会检查语法是否正确,并将 SQL 语句转化为内部的数据结构(通常是语法树)。 示例 SQL 语句: UPDATE employees SET salary 5000 WHERE department Sa…...

在 Ubuntu 18.04 中搭建和测试 DNS 服务器

在 Ubuntu 18.04 中搭建和测试 DNS 服务器可以通过安装和配置 BIND(Berkeley Internet Name Domain)来实现。以下是详细的步骤: 1. 安装 BIND 打开终端并运行以下命令来安装 BIND: sudo apt update sudo apt install bind9 bin…...