当前位置：首页 > news >正文

【OpenCV】人脸识别方法

news 2025/7/6 18:25:04

代码已上传GitHub：plumqm/OpenCV-Projects at master

EigenFace、FisherFace、LBPHFace

这三种方法的代码区别不大所以就一段代码示例。

EigenFace与FisherFace

1. 将人脸图像展开为一维向量，组成训练数据集

2. PCA（EigenFace）或LDA（FisherFace）特征分解，得到一组特征向量，代表了训练集中人脸的主要特征，即特征脸

3. 将新的人脸展平为向量，减去训练数据的特征脸（即归一化）

4. 人脸向量与特征向量进行点积，得到在特征空间中的投影坐标

5. 投影得到的新坐标向量与数据库中已存的人脸投影坐标进行比较。通过计算距离（如欧氏距离），找到最相似的匹配，进行身份识别。

EigenFace和FisherFace的主要区别在于它们使用的特征分解方法不同：

FisherFace对光照、表情、姿态变化更具鲁棒性，因为它专注于区分类别，而不是仅仅关注图像的整体方差。

PCA只是从全局数据出发，而没有考虑类别之间的区分。这意味着，它虽然对所有人脸都有较好的重建能力，但可能对区分不同个体的表现较差，特别是当光照或姿态变化较大时。

EigenFace（PCA）注重最大化数据的方差，它主要捕捉的是图像中的全局特征，不区分类别。
FisherFace（LDA）则注重区分不同个体，最大化类间差异，因此在分类问题中通常表现得更好。

LBPH工作原理

LBPH算法通过将人脸图像分成多个小的局部区域，并计算每个区域的局部二值模式（Local Binary Patterns, LBP）直方图来描述这些区域的纹理特征。然后，它将这些局部直方图串联起来形成一个特征向量，这个特征向量就可以用来识别或分类人脸。

具体步骤：

灰度图转换：

首先，LBPH算法需要输入一张灰度图像。因为LBPH主要基于像素的纹理特征，所以不需要彩色信息，直接将人脸图像转换为灰度图即可。

计算局部二值模式（LBP）：

对于每个像素点，LBP算法将以它为中心，比较它与周围8个像素的灰度值。根据灰度值的大小，将大于或等于中心像素的邻近像素标记为1，反之为0，得到一个8位二进制数。这个二进制数就是该像素的局部二值模式值。
例如，假设中心像素值为 50，周围的像素值为 [55, 60, 45, 30, 70, 40, 80, 90]，根据规则将大于50的像素标记为1，小于的标记为0，得到的二进制模式可能是11010101，转换为十进制就是213。

划分区域：

将人脸图像分成若干个小的区域（通常是网格状，如10x10的网格），然后对每个区域计算该区域内所有像素的LBP直方图。

构建特征向量：

对于每个区域，LBPH都会计算局部二值模式的直方图，这些直方图包含了该区域内纹理的统计信息。然后，将所有区域的直方图连接起来，形成一个完整的特征向量。

特征匹配：

一旦提取了人脸的特征向量，就可以使用距离度量方法（如欧氏距离、卡方距离等）来比较新的人脸图像与数据库中已知的人脸特征向量。如果两个特征向量的距离足够小，则判定这两张人脸是同一个人。

准备阶段

导入包

import numpy as np
import cv2
import matplotlib.pyplot as plt
import dlib%matplotlib inline

读取gif格式

读取gif格式的文件，通过调用cv2的VideoCapture方法

# 读取gif格式img_path = './images/yalefaces/subject01.gif'
cap = cv2.VideoCapture(img_path)
ret,img = cap.read()
plt.imshow(cv2.cvtColor(img,cv2.COLOR_BGR2RGB))

Hog人脸检测器

#构造hog人脸检测器
hog_face_detector = dlib.get_frontal_face_detector()

图片预处理

用hog检测器检测出人脸部分，返回截取的人脸部分和标签

# 图片预处理
def getFaceImgLabel(filename):cap = cv2.VideoCapture(filename)ret,img = cap.read()# 转灰度图img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 检测人脸detections = hog_face_detector(img, 1)if len(detections) > 0:# 获取人脸区域坐标x = detections[0].left()y = detections[0].top()r = detections[0].right()b = detections[0].bottom()# 截取人脸img_crop = img[y:b,x:r]img_crop = cv2.resize(img_crop,(120,120))# 获取人脸labellabel_id = int(filename.split('/')[-1].split('.')[0].split('subject')[-1])return img_crop, label_idelse :return None, -1# img,label = getFaceImgLabel(img_path)
# plt.imshow(cv2.cvtColor(img,cv2.COLOR_BGR2RGB))

处理训练集

把训练集即train文件夹下的内容存入img_list，标签存入label_list，以便后面train函数直接训练


# 遍历训练文件夹
import glob
file_list = glob.glob('./images/yalefaces/*.gif')img_list =[]
label_list = []for file in file_list:img_crop, label_id = getFaceImgLabel(file)if img_crop is not None:img_list.append(img_crop)label_list.append(label_id)# print(len(img_list),len(label_list))

构造分类器

这个就包含三种方法，EigenFace、FisherFace、LBPHFace。

后面两种方法要求输入的图片大小一致，但是第一种没有要求，我们的代码就统一resize了。

# 构造分类器
face_cls = cv2.face.LBPHFaceRecognizer_create()
# cv2.face.EigenFaceRecognizer_create()
# cv2.face.FisherFaceRecognizer_create()# 后面两个方法要求人脸大小一致

训练

# 训练
face_cls.train(img_list, np.array(label_list))

试验图片

# 预测图片
test_file = './images/test/subject06.sad.gif'img_crop, label_id = getFaceImgLabel(test_file)plt.imshow(cv2.cvtColor(img_crop,cv2.COLOR_BGR2RGB))  # 显示图片
# plt.imshow(img_crop)    
if img_crop is not None:predict_id,distance = face_cls.predict(img_crop)print(predict_id)

评估模型

其实也就是在试验单张图片的基础上通过大量测试集来评估模型好坏。

# 评估模型import glob
file_list = glob.glob('./images/test/*.gif')true_list = []
predict_list = []for file in file_list:img_crop, label_id = getFaceImgLabel(file)if img_crop is not None:predict_id,distance = face_cls.predict(img_crop)predict_list.append(predict_id)true_list.append(label_id)print(predict_list)
print(true_list)

查看准确率

# 查看准确率
from sklearn.metrics import accuracy_score 
accuracy_score(true_list,predict_list)

结果可视化

# 获取融合矩阵
from sklearn.metrics import confusion_matrix 
cm = confusion_matrix(true_list,predict_list)
cm# 可视化
import seaborn
seaborn.heatmap(cm,annot=True)

热力图：

（因为我没找到好的测试集，test文件夹就直接放的训练集的图片，所以结果怪怪的）

保存模型

# 保存模型
path = './weights/LBPG.yml'
face_cls.save(path)# 调用模型
new_cls = cv2.face.LBPHFaceRecognizer_create()
new_cls.read(path)# 预测一张图片
test_file = './images/test/subject06.sad.gif'img_crop, label_id = getFaceImgLabel(test_file)# plt.imshow(cv2.cvtColor(img_crop,cv2.COLOR_BGR2RGB))  # 显示图片
# plt.imshow(img_crop)    
if img_crop is not None:predict_id,distance = new_cls.predict(img_crop)print(predict_id)

Residual Network

导入包

import numpy as np
import cv2
import matplotlib.pyplot as plt
import dlib# %matplotlib inline
plt.rcParams['figure.dpi'] = 200

提取关键点

# 获取人脸68个关键点
hog_face_detector = dlib.get_frontal_face_detector()
# 关键点检测模型
shape_detector = dlib.shape_predictor('./weights/shape_predictor_68_face_landmarks.dat')

# 读取1张测试图片
img = cv2.imread('./images/others/Walid_Al-Awadi/Walid_Al-Awadi_0001.jpg')
# plt.imshow(img)
# 检测人脸
detections = hog_face_detector(img,1)for face in detections:l,t,r,b = face.left(),face.top(),face.right(),face.bottom()# 获取68个关键点points = shape_detector(img,face)# 绘制关键点for point in points.parts():cv2.circle(img,(point.x,point.y),2,(0,255,0),1)# 绘制矩形框cv2.rectangle(img,(l,t),(r,b),(255,0,0),2)plt.imshow(cv2.cvtColor(img,cv2.COLOR_BGR2RGB))

导入Resent模型

# resent模型
face_descriptor_extractor = dlib.face_recognition_model_v1('./weights/dlib_face_recognition_resnet_model_v1.dat')

提取单张图片的特征描述符和label

通过face_descriptor_extractor.compute_face_descriptor计算特征描述符

# 提取单张图片的特征描述符label
def getFaceFeatLabel(filename):label_id = int(filename.split('/')[-1].split('.')[0].split('subject')[-1])# 读取图片cap = cv2.VideoCapture(filename)ret,img = cap.read()img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)# 检测人脸detections = hog_face_detector(img, 1)face_decriptor = Nonefor face in detections:# 获取关键点points = shape_detector(img,face)# 获取特征描述符face_decriptor = face_descriptor_extractor.compute_face_descriptor(img,points)# 转为numpy格式数组face_decriptor = [f for f in face_decriptor]face_decriptor = np.asarray(face_decriptor,dtype=np.float64)face_decriptor = np.reshape(face_decriptor,(1,-1))return label_id,face_decriptor
# img,label = getFaceImgLabel(img_path)
# plt.imshow(cv2.cvtColor(img,cv2.COLOR_BGR2RGB))id1,fd1 = getFaceFeatLabel('./images/test/subject06.sad.gif')
fd1.shape

训练

# 遍历训练文件夹
import glob
file_list = glob.glob('./images/yalefaces/*.gif')
file_list = [file.replace('\\', '/') for file in file_list]label_list = []
feature_list = Nonename_list = {}
index = 0
for file in file_list:label, feature = getFaceFeatLabel(file)if feature is not None:# 文件名列表name_list[index] = file# label列表label_list.append(label)index += 1if feature_list is None:feature_list = featureelse:    # 特征列表feature_list = np.concatenate((feature_list ,feature),axis=0)# feature_list = np.concatenate((feature_list, feature.reshape(1, -1)), axis=0)# print(len(img_list),len(label_list))
print(name_list)

评估模型

距离的计算

# 计算距离
np.linalg.norm((feature_list[20]-feature_list[100]))# 计算某个特征描述符与所有特征描述符的距离
np.linalg.norm((feature_list[100]-feature_list),axis=1)# 寻找最小值索引min_index = np.argmin(np.linalg.norm((feature_list[0]-feature_list[1:]),axis=1))
min_index

模型评估

# 评估模型import glob
file_list = glob.glob('./images/test/*.gif')
file_list = [file.replace('\\', '/') for file in file_list]label_list = []
predict_list = []# 距离阈值
threshold = 0.5for file in file_list:label, feat = getFaceFeatLabel(file)cap = cv2.VideoCapture(file)ret,img = cap.read()img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)if feat is not None:# 计算距离distances = np.linalg.norm((feat-feature_list),axis=1)# 找最短距离min_index = np.argmin(distances)min_distance = distances[min_index]if min_distance < threshold:# 同一个人predict_id = int(name_list[min_index].split('/')[-1].split('.')[0].split('subject')[-1])else:predict_id = -1predict_list.append(predict_id)label_list.append(label)cv2.putText(img,'True:'+str(label),(10,30),cv2.FONT_HERSHEY_COMPLEX_SMALL,1,(0,255,0))cv2.putText(img,'Pred:'+str(predict_id),(10,50),cv2.FONT_HERSHEY_COMPLEX_SMALL,1,(0,255,0))cv2.putText(img,'Dist:'+str(min_distance),(10,70),cv2.FONT_HERSHEY_COMPLEX_SMALL,1,(0,255,0))plt.figure()plt.imshow(img)print(len(label_list))
print(len(predict_list))

准确率

# 公式评估
from sklearn.metrics import accuracy_score
accuracy_score(label_list,predict_list)

【OpenCV】人脸识别方法

代码已上传GitHub：plumqm/OpenCV-Projects at master EigenFace、FisherFace、LBPHFace 这三种方法的代码区别不大所以就一段代码示例。 EigenFace与FisherFace 1. 将人脸图像展开为一维向量，组成训练数据集 2. PCA（EigenFace）或…...

编程日记 2024/10/22 4:26:58

xxl-job定时任务

学习中心清理Redis中的历史榜单： 持久化榜单数据： 创建历史榜单表： 支付服务待退款订单检查： 未支付订单检查： 交易服务退款单处理： 促销中心优惠券发放状态处理：...

编程日记 2024/10/22 4:25:57

C#从零开始学习(如何构建应用)(1)

开始使用 C# 本章所有的代码都放在 https://github.com/hikinazimi/head-first-Csharp 创建一个控制台应用打开Visual Studio 2019 创建项目选择控制台应用程序创建后点击运行,就可以在控制台打印Hello World 构建一个游戏(创建WPF项目) 构建游戏的步骤首先创建WPF项…...

编程日记 2024/10/22 4:24:56

OpenCV高级图形用户界面(7)获取指定窗口的属性值函数getWindowProperty()的使用

操作系统：ubuntu22.04 OpenCV版本：OpenCV4.9 IDE:Visual Studio Code 编程语言：C11 算法描述提供窗口的参数。函数 getWindowProperty 返回窗口的属性。 cv::getWindowProperty() 函数用于获取指定窗口的属性值。这个函数允许你查询窗口…...

编程日记 2024/10/22 4:23:55

Java实现文件上传功能

目录 1、准备工作 2、注意事项 3、jsp页面代码 4、Servlet 5、注册Servlet 1、准备工作导入依赖：commons-fileupload和commons-io 2、注意事项 ①为保证服务器安全，上传文件应该放在外界无法直接访问的目录下，比如WEB-INF目录下 ②为…...

编程日记 2024/10/22 4:22:54

Leetcode|24. 两两交换链表中的节点 ● 19.删除链表的倒数第N个节点 ● 面试题 02.07. 链表相交 ● 142.环形链表II

24. 注意：涉及头节点的修改或者删除时，最好设置一个虚拟的头结点，方便简化代码，不必进行是否为头节点的的判断，简化code class Solution { public:ListNode* swapPairs(ListNode* head) {ListNode* dummyHead new Li…...

编程日记 2024/10/22 4:21:47

OpenCV学习笔记5——图像的数值计算

目录一、简单数值计算二、opencv中提供函数进行计算三、cv2.addWeighted 一、简单数值计算在opencv中，我们有许多可以获取图像各类数值的办法，许多函数能获得各种方面的数据。但如果我们什么都不用，仅仅对图像上每一个点做加法运算会…...

编程日记 2024/10/22 4:20:45

P3137 [USACO16FEB] Circular Barn S

P3137 [USACO16FEB] Circular Barn S 思路：数据范围为O(n^2)那么因此我们可以暴力，那么如何进行构造呢？首先假设一头奶牛在a，一头在b，如果要使一个到b，另一个到c，（a<b<c)&…...

编程日记 2024/10/22 4:17:43

yocto编辑软件包-devtool的使用方法

之前用了很多次devtool，总是忘记用法，故此记录一下。假设你有一个软件包名叫foo，并且已经下载编译过，需要修改它的源码并生成patch 生成修改工作区 devtool modify foo modify命令会将foo的源码压缩包解压到build/workspace/so…...

编程日记 2024/10/22 4:16:40

51单片机快速入门之串行通信 2024/10/21

51单片机快速入门之串行通信并行通信: 好处:传输快适合短距离通信弊端:占用大量io 接线形式为8对8 串行通信异步通信: 数据一帧一帧传送,传输完一帧之后,可继续或者等待(等待时为高电平) 其帧细分为(图片来源) 起始位:数据帧开始,一定为 0 外部设备只有接受到 0 之后…...

编程日记 2024/10/22 4:11:36

webpack 老项目升级记录：node-sass 规定的 node v8 提升至支持 node v22

老项目简介技术框架 vue 2.5.17webpack 4.16.5"webpack-cli": "3.1.0""node-sass": "^4.7.2" 几个阶段第一步：vue2 升级到最新第一步：升级 vue2 至最新版本，截止到目前（2024-10-…...

编程日记 2024/10/22 4:10:35

【wpf】08 xml文件的存取操作

在使用wpf编程过程中，会用到xml的配置文件，实现对其读取和存储的操作是必须的。 1 xml说明可扩展标记语言 (Extensible Markup Language, XML) ，标准通用标记语言的子集，可以用来标记数据、定义数据类型，是一种允许…...

编程日记 2024/10/22 4:08:32

即时通讯代码优化

在线用户逻辑修复在进行测试时，发现当前代码有个问题，如果test1在服务器进行连接，本地的test2给test1发消息，虽然test1能收到服务器上的信息，但是本地服务日志中会报teset1不在线，需要对该种情况进行修复…...

编程日记 2024/10/22 4:05:28

jmeter学习（8）界面的使用

1、新建test plan 3、打开文件 4、保存 5、剪切 6、复制 7、粘贴 8、所有线程组展开 9、所有线程组收缩 10、置灰，操作后无法使用 11、执行 13、清空当前线程组结果 14、清空所有线程组结果 15、函数助手搜索，可以用于搜索某个请求&#x…...

编程日记 2024/10/22 4:03:26

记录一次hiveserver2卡死(假死)问题

问题描述给开发人员开通了个账号，连接hive进行查询，后来发现，hive服务有时候会卡死，查询不了，连不上（所有账号/客户端都连不上hive），但在chd里面看监控，服务器资源状态…...

编程日记 2024/10/22 4:02:24

【ios】在 SwiftUI 中实现可随时调用的加载框

在 SwiftUI 项目中实现一个自定义的加载框（loading）功能，可以在任意位置调用，以便显示加载动画或者进度条。下面的教程将详细讲解如何创建一个可复用的 Loading 组件，并通过通知机制控制其显示和隐藏。先上效果&…...

编程日记 2024/10/22 4:01:24

字符、解释型语言、编程语言的互操作、输出

字符同样是1，有人看到的是数字，有人看到的是字符，还有人看到的是一个小目标。不同语言的字符正则表达式把字符分成普通字符和元字符，元字符为了搭配匹配。比如.代表任意非换行字符，这对于通配很简便，用\…...

编程日记 2024/10/22 4:00:22

基于Python的自然语言处理系列（39）：Huggingface中的解码策略

在自然语言生成任务中，如何选择下一步的单词或者词语对生成的文本质量影响巨大。Huggingface 提供了多种解码策略，可以在不同的场景下平衡流畅度、创造力以及生成效率。在这篇文章中，我们将逐步介绍 Huggingface 中的几种常见解码策略&#x…...

编程日记 2024/10/22 3:58:20

如何将视频格式转为mp4？好好看看下面这几个方法

如何将视频格式转为mp4？在数字化时代，视频已成为信息传播与娱乐消遣的重要载体。无论是学习、工作还是日常生活，我们几乎每天都会接触到各式各样的视频内容。然而，不同设备、平台或软件生成的视频文件往往采用不同的编码格式&…...

编程日记 2024/10/22 3:55:18

景区智慧公厕系统，监测公厕异味，自动清洁除臭

随着旅游业的快速发展，景区的公共厕所管理成为提升游客体验的重要环节。传统的公厕管理方式存在诸多不足，如卫生条件差、异味严重等问题。为了改善这些问题，许多景区开始采用智慧公厕系统。这种系统能够实时监测公厕内的异味，并自…...

编程日记 2024/10/22 3:54:17

Python爬虫实战：研究MechanicalSoup库相关技术

一、MechanicalSoup 库概述 1.1 库简介 MechanicalSoup 是一个 Python 库，专为自动化交互网站而设计。它结合了 requests 的 HTTP 请求能力和 BeautifulSoup 的 HTML 解析能力，提供了直观的 API，让我们可以像人类用户一样浏览网页、填写表单和提交请求。 1.2 主要功能特点…...

编程新知 2025/6/21 11:59:52

19c补丁后oracle属主变化，导致不能识别磁盘组

补丁后服务器重启，数据库再次无法启动 ORA01017: invalid username/password; logon denied Oracle 19c 在打上 19.23 或以上补丁版本后，存在与用户组权限相关的问题。具体表现为，Oracle 实例的运行用户（oracle）和集…...

编程新知 2025/7/5 21:35:40

7.4.分块查找

一.分块查找的算法思想： 1.实例： 以上述图片的顺序表为例， 该顺序表的数据元素从整体来看是乱序的，但如果把这些数据元素分成一块一块的小区间， 第一个区间[0,1]索引上的数据元素都是小于等于10的， 第二…...

编程新知 2025/7/4 22:56:30

springboot 百货中心供应链管理系统小程序

一、前言随着我国经济迅速发展，人们对手机的需求越来越大，各种手机软件也都在被广泛应用，但是对于手机进行数据信息管理，对于手机的各种软件也是备受用户的喜爱，百货中心供应链管理系统被用户普遍使用，为方…...

编程新知 2025/7/4 15:52:31

java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别

UnsatisfiedLinkError 在对接硬件设备中，我们会遇到使用 java 调用 dll文件的情况，此时大概率出现UnsatisfiedLinkError链接错误，原因可能有如下几种类名错误包名错误方法名参数错误使用 JNI 协议调用，结果 dll 未实现 JNI 协…...

编程新知 2025/7/4 22:49:12

JUC笔记(上)-复习涉及死锁 volatile synchronized CAS 原子操作

一、上下文切换即使单核CPU也可以进行多线程执行代码，CPU会给每个线程分配CPU时间片来实现这个机制。时间片非常短，所以CPU会不断地切换线程执行，从而让我们感觉多个线程是同时执行的。时间片一般是十几毫秒(ms)。通过时间片分配算法执行。…...

编程新知 2025/6/26 2:36:23

基于Java+MySQL实现（GUI）客户管理系统

客户资料管理系统的设计与实现第一章需求分析 1.1 需求总体介绍本项目为了方便维护客户信息为了方便维护客户信息，对客户进行统一管理，可以把所有客户信息录入系统，进行维护和统计功能。可通过文件的方式保存相关录入数据，对…...

编程新知 2025/7/5 22:22:50

C/C++ 中附加包含目录、附加库目录与附加依赖项详解

在 C/C 编程的编译和链接过程中，附加包含目录、附加库目录和附加依赖项是三个至关重要的设置，它们相互配合，确保程序能够正确引用外部资源并顺利构建。虽然在学习过程中，这些概念容易让人混淆，但深入理解它们的作用和联…...

编程新知 2025/7/6 15:55:44

鸿蒙（HarmonyOS5）实现跳一跳小游戏

下面我将介绍如何使用鸿蒙的ArkUI框架，实现一个简单的跳一跳小游戏。 1. 项目结构 src/main/ets/ ├── MainAbility │ ├── pages │ │ ├── Index.ets // 主页面 │ │ └── GamePage.ets // 游戏页面 │ └── model │ …...

编程新知 2025/6/12 10:12:13

加密通信 + 行为分析：运营商行业安全防御体系重构

在数字经济蓬勃发展的时代，运营商作为信息通信网络的核心枢纽，承载着海量用户数据与关键业务传输，其安全防御体系的可靠性直接关乎国家安全、社会稳定与企业发展。随着网络攻击手段的不断升级，传统安全防护体系逐渐暴露出局限性&a…...

编程新知 2025/7/5 20:17:27

EigenFace、FisherFace、LBPHFace

准备阶段

导入包

读取gif格式

Hog人脸检测器

图片预处理

处理训练集

构造分类器

训练

试验图片

评估模型

查看准确率

结果可视化

保存模型

Residual Network

导入包

提取关键点

导入Resent模型

提取单张图片的特征描述符和label

训练

评估模型

距离的计算

模型评估

准确率

相关文章：