当前位置：首页 > news >正文

ROS opencv 人脸识别

news 2026/2/10 22:09:43

人脸识别需要在输入的图像中确定人脸（如果存在）的位置、大小和姿态，往往用于生物特征识别、视频监听、人机交互等应用中。2001年，Viola和Jones提出了基于Haar特征的级联分类器对象检测算法，并在2002年由Lienhart和Maydt进行改进，为快速、可靠的人脸检测应用提
供了一种有效方法。OpenCV已经集成了该算法的开源实现，利用大量样本的Haar特征进行分类器训练，然后调用训练好的瀑布级联分类器cascade进行模式匹配。

应用效果

OpenCV已经集成了人脸识别算法，所以我们不需要重新开发该算法，只需要调用OpenCV相应的接口就可以实现人脸识别的功能。

下面运行例程看一下人脸识别是一种怎样的效果。
使用以下命令启动摄像头，然后运行face_detector.launch文件启动人脸识别功能：

roslaunch robot_vision usb_cam.launch

roslaunch robot_vision face_detector.launch

在这里插入图片描述

源码实现

现在再回头研究这个例程的源码实现方法。该应用的实现代码只有一个文件，即
robot_vision/script/face_detector.py，主要分成以下三个部分。

1.初始化部分
初始化部分主要完成ROS节点、图像、识别参数的设置。

def __init__(self):
rospy.on_shutdown(self.cleanup);

创建cv_bridge

self.bridge = CvBridge()
self.image_pub = rospy.Publisher("cv_bridge_image", Image, queue_size=1)

获取haar特征的级联表的XML文件，文件路径在launch文件中传入

cascade_1 = rospy.get_param("~cascade_1", "")
cascade_2 = rospy.get_param("~cascade_2", "")
# 使用级联表初始化haar特征检测器
self.cascade_1 = cv2.CascadeClassifier(cascade_1)
self.cascade_2 = cv2.CascadeClassifier(cascade_2)
# 设置级联表的参数，优化人脸识别，可以在launch文件中重新配置
self.haar_scaleFactor = rospy.get_param("~haar_scaleFactor", 1.2)
self.haar_minNeighbors = rospy.get_param("~haar_minNeighbors", 2)
self.haar_minSize = rospy.get_param("~haar_minSize", 40)
self.haar_maxSize = rospy.get_param("~haar_maxSize", 60)
self.color = (50, 255, 50)
# 初始化订阅rgb格式图像数据的订阅者，此处图像topic的话题名可以在launch文件中重映射
self.image_sub = rospy.Subscriber("input_rgb_image", Image, self.image_callback, queue_size=1)

2.ROS图像回调函数
例程节点收到摄像头发布的RGB图像数据后进入回调函数，将图像转换成OpenCV的数据
格式，然后预处理之后开始调用人脸识别的功能函数，最后发布识别结果。
def image_callback(self, data):

使用cv_bridge将ROS的图像数据转换成OpenCV的图像格式

try:
cv_image = self.bridge.imgmsg_to_cv2(data, "bgr8")
frame = np.array(cv_image, dtype=np.uint8)
except CvBridgeError, e:
print e
# 创建灰度图像
grey_image = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
# 创建平衡直方图，减少光线影响
grey_image = cv2.equalizeHist(grey_image)
# 尝试检测人脸
faces_result = self.detect_face(grey_image)
# 在OpenCV的窗口中框出所有人脸区域
if len(faces_result)>0:
for face in faces_result:
x, y, w, h = face
cv2.rectangle(cv_image, (x, y), (x+w, y+h), self.color, 2)
# 将识别后的图像转换成ROS消息并进行发布
self.image_pub.publish(self.bridge.cv2_to_imgmsg(cv_image, "bgr8"))

3.人脸识别
人脸识别部分没有很多代码，直接调用OpenCV提供的人脸识别接口，与数据库中的人脸特
征进行匹配。

def detect_face(self, input_image):
# 首先匹配正面人脸的模型
if self.cascade_1:
faces = self.cascade_1.detectMultiScale(input_image,
self.haar_scaleFactor,
self.haar_minNeighbors,
cv2.CASCADE_SCALE_IMAGE,
(self.haar_minSize, self.haar_maxSize))

如果正面人脸匹配失败，那么就尝试匹配侧面人脸的模型

if len(faces) == 0 and self.cascade_2:
faces = self.cascade_2.detectMultiScale(input_image,
self.haar_scaleFactor,
self.haar_minNeighbors,
cv2.CASCADE_SCALE_IMAGE,
(self.haar_minSize, self.haar_maxSize))
return faces

代码中有一些参数和话题名需要在launch文件中设置，所以还需要编写一个运行例程的
launch文件robot_vision/launch/face_detector.launch：

<launch>
<node pkg="robot_vision" name="face_detector" type="face_detector.py" output="screen">
<remap from="input_rgb_image" to="/usb_cam/image_raw" />
<rosparam>
haar_scaleFactor: 1.2
haar_minNeighbors: 2
haar_minSize: 40
haar_maxSize: 60
</rosparam>
<param name="cascade_1" value="$(find robot_vision)/data/haar_detectors/haarcascade_frontalface_alt.xml" />
<param name="cascade_2" value="$(find robot_vision)/data/haar_detectors/haarcascade_profileface.xml" />
</node>
</launch>

以上我们结合ROS和OpenCV实现了一个人脸识别的机器视觉应用。

ROS opencv 人脸识别

人脸识别需要在输入的图像中确定人脸（如果存在）的位置、大小和姿态，往往用于生物特征识别、视频监听、人机交互等应用中。2001年，Viola和Jones提出了基于Haar特征的级联分类器对象检测算法，并在2002年由Lienhart和Mayd…...

编程日记 2023/10/19 2:06:18

文心一言 4.0 ERNIE-Bot 4.0 ：ERNIE-Bot 4.0 大模型深度测试体验报告

本心、输入输出、结果文章目录文心一言 4.0 ERNIE-Bot 4.0 ：ERNIE-Bot 4.0 大模型深度测试体验报告前言相关跳转文心一言 4.0 ERNIE-Bot 4.0 接口简介Bash 请求示例代码Windows 模式使用 Python 请求如果直接使用官方提供的代码文心一言 4.0 ERNIE-Bot 4.0 API 在…...

编程日记 2023/10/19 2:05:17

华为OD机考B卷 | 100分】阿里巴巴找黄金宝箱（JAVA题解——也许是全网最详）

前言本人是算法小白，甚至也没有做过Leetcode。所以，我相信【同为菜鸡的我更能理解作为菜鸡的你们的痛点】。题干 1. 题目描述一贫如洗的樵夫阿里巴巴在去砍柴的路上，无意中发现了强盗集团的藏宝地，藏宝地有编号从0~N的箱子&…...

编程日记 2023/10/19 2:04:16

请求转发和重定向区别

两者区别： 1.转发在一次请求中完成，重定向是两次请求 2.转发操作发生在服务器内部，重定向是在浏览器执行操作 3.转发地址栏不变，重定向地址栏变化（两次请求，两个地址） 4.转发可以在一次请求中共…...

编程日记 2023/10/19 2:03:15

JS如何判断对象为空？以及各自的缺点。 Object.keys() 通过 Object.keys() 来获取对象的键进行判断。 function isEmpty(obj) {return Object.keys(obj).length 0; }console.log(isEmpty({})); // true console.log(isEmpty({ a: 1 })); // false缺点&#xff1a…...

编程日记 2023/10/19 2:02:14

同城代驾开源版小程序开发

同城代驾开源版小程序开发功能特性描述： 定价模式：本系统支持灵活的计价模式，包括白天和夜晚的起步价、起步里程、每公里价以及超时费用，从而满足不同时段的定价需求。实时路径计算：通过集成腾讯地图的软件开发工…...

编程日记 2023/10/19 2:01:14

【Python机器学习】零基础掌握ShrunkCovariance协方差估计

有没有想过如何准确地评估股票投资的风险？在投资领域，了解各种资产（如股票、债券等）之间的相关性和波动性是非常重要的。常用的方法是计算资产收益率的协方差矩阵，但这个矩阵在样本量少或数据质量不高的情况下可能会产生误导。那么，有没有更好的方法来解决这个问题呢？…...

编程日记 2023/10/19 2:00:12

精神科常用评估量表汇总，建议收藏！

根据精神科医生的量表使用情况，笔者整理了10个精神科常用量表，可在线评测直接出结果，可转发使用，可生成二维码使用，可创建项目进行数据管理，有需要的小伙伴赶紧收藏！ 抑郁自评量表抑郁自评量表…...

编程日记 2023/10/19 1:59:12

Python之切片

Python之切片切片通过给定的索引区间获得线性结构的一部分数据start、stop、step为整数，可以是正整数、负整数、零start为0时，可以省略stop为末尾时，可以省略step为1时，可以省略切片时，索引超过上界(右边界)&#…...

编程日记 2023/10/19 1:58:11

OpenCV显示中文（python）

OpenCV添加文字的方法putText(…)，添加英文是没有问题的，但如果你要添加中文就会出现“？？？”的乱码，需要特殊处理一下。下文提供封装好的（代码）方法，供OpenCV添加中文使…...

编程日记 2023/10/19 1:57:10

k8s-18 认证授权

Authentication (认证) 认证方式现共有8种，可以启用一种或多种认证方式，只要有一种认证方式通过，就不再进行其它方式的认证。通常启用X509 Client Certs和Service Accout Tokens两种认证方式 Kubernetes集群有两类用户:由Kubernetes管理的Ser…...

编程日记 2023/10/19 1:56:09

WebAPI+EF连接SQL Server数据库

右击解决方案-添加-新建项目-选择“类库（.NET Framework）”,新建的项目取名叫WebApi1.EF 添加EF： 新建一个ADO实体数据模型选择DBFirst 数据源选择MySql 填写数据库地址及账号密码选择实体框架版本选择在数据库中的表User 到此配置完成&am…...

编程日记 2023/10/19 1:55:08

maven-plugin-shade 详解1

maven-plugin-shade 是 Maven 的一个插件，它的作用是将多个 jar 包合并成一个 jar，同时将其中的依赖关系也合并到该 jar 中。这个插件常用于创建可执行 jar 包和打包 web 应用程序。下面是 maven-plugin-shade 的一些常用配置： 打包的形式&…...

编程日记 2023/10/19 1:54:07

C#中LinkedList、Queue＜T＞和Stack＜T＞的使用

1、LinkedList(链表) 链表中元素存储内存中是不连续分配，每个元素都有记录前后节点，节点值可以重复，不能通过下标访问，泛型的使用保证类型安全，可以避免装箱拆箱，找元素就只能遍历，查找不方便&…...

编程日记 2023/10/19 1:52:05

流程图如何制作？好用的11款流程图软件盘点！

流程图是一种强大的可视化工具，用于清晰地展示各种过程和步骤，应用非常广泛，在各个行业中随处可见，凡是涉及流程步骤的场景，都可以用到流程图，那么问题来了：流程图如何制作？ 这篇文…...

编程日记 2023/10/19 1:50:03

windows本地文件上传linux 或 linux输入rz命令后出现receive.**B0100000023be50

这种现象需要客户端支持，或者使用Xshell工具等但是有一种简单的方法，使用 sftp rootip地址 // 比如 sftp root127.0.0.2 当然，你要记得登录远程节点的密码：...

编程日记 2023/10/19 1:48:01

C# CodeFormer Inpainting 人脸填充

效果项目代码 using Microsoft.ML.OnnxRuntime; using Microsoft.ML.OnnxRuntime.Tensors; using OpenCvSharp; using System; using System.Collections.Generic; using System.Drawing; using System.Drawing.Imaging; using System.Windows.Forms;namespace CodeFormer_D…...

编程日记 2023/10/19 1:47:00

ROS opencv 人脸识别

应用效果

源码实现

创建cv_bridge

获取haar特征的级联表的XML文件，文件路径在launch文件中传入

使用cv_bridge将ROS的图像数据转换成OpenCV的图像格式

相关文章：

ROS opencv 人脸识别

文心一言 4.0 ERNIE-Bot 4.0 ：ERNIE-Bot 4.0 大模型深度测试体验报告

华为OD机考B卷 | 100分】阿里巴巴找黄金宝箱（JAVA题解——也许是全网最详）

请求转发和重定向区别

JS如何判断对象为空？以及各自的缺点。

同城代驾开源版小程序开发

【Python机器学习】零基础掌握ShrunkCovariance协方差估计

精神科常用评估量表汇总，建议收藏！

Python之切片

OpenCV显示中文（python）

k8s-18 认证授权

WebAPI+EF连接SQL Server数据库

maven-plugin-shade 详解1

C#中LinkedList、Queue＜T＞和Stack＜T＞的使用

流程图如何制作？好用的11款流程图软件盘点！

windows本地文件上传linux 或 linux输入rz命令后出现receive.**B0100000023be50

C# CodeFormer Inpainting 人脸填充

将Sketch文件转化为PSD文件的简单在线工具！

【广州华锐互动】利用AR进行野外地质调查学习，培养学生实践能力

Jmeter快速入门

Chapter03-Authentication vulnerabilities

vscode里如何用git

【CSS position 属性】static、relative、fixed、absolute 、sticky详细介绍，多层嵌套定位示例

C# 类和继承(抽象类)

【RockeMQ】第2节｜RocketMQ快速实战以及核⼼概念详解（二）

NFT模式：数字资产确权与链游经济系统构建

Typeerror: cannot read properties of undefined (reading ‘XXX‘)

高效线程安全的单例模式：Python 中的懒加载与自定义初始化参数

Python Ovito统计金刚石结构数量

计算机基础知识解析：从应用到架构的全面拆解