MATLAB实战:人脸检测与识别实现方案
我们要用电脑识别照片或视频中的人脸,并知道是谁的脸。就像手机相册能自动识别照片里的人是谁一样。
🔍 人脸检测(找脸)
目标:在图片中找到人脸的位置
怎么做:
-
用MATLAB的"人脸扫描仪"(
vision.CascadeObjectDetector
) -
这个扫描仪的工作原理:
-
像在图片上移动一个"放大镜"🔍
-
检查每个区域是否符合人脸特征(眼睛、鼻子、嘴巴的排列)
-
发现人脸就用方框标出来
-
举个栗子🌰:
你给电脑一张班级合照,它会在每个人脸上画个红框。
👤 人脸识别(认人)
目标:认出这是谁的脸
步骤:
-
准备"人脸相册":
收集每个人的多张照片(不同角度、表情) -
提取"人脸指纹":
-
电脑不是记整张脸,而是记关键特征
-
两种常用方法:
-
HOG特征:记录脸部轮廓线条的方向(像画简笔画✏️)
-
LBP特征:记录皮肤纹理的斑点图案(像记雀斑位置)
-
-
-
训练"人脸识别专家":
-
用SVM(支持向量机)算法
-
把"张三"的脸部特征和名字关联起来
-
就像教小孩:"这种眼睛+鼻子组合是张三"
-
-
识别新人脸:
-
当看到新照片时:
-
先找到人脸位置(检测)
-
提取这个人的"脸部指纹"
-
问SVM专家:"这个指纹最像相册里的谁?"
-
-
💡 技术亮点
-
Viola-Jones算法(找脸神器):
-
超快扫描,能处理模糊/侧脸
-
原理:用多个简单特征快速排除非人脸区域
-
-
HOG+LBP(黄金组合):
-
HOG:擅长捕捉轮廓(适合辨认脸型)
-
LBP:擅长记录纹理(适合辨认皮肤细节)
-
合起来=看脸型+看肤质,双保险
-
-
SVM分类器(最强大脑):
-
在特征空间画"分界线"
-
例如:张三的脸部特征在A区,李四的在B区
-
新人脸落在哪个区就判断是谁
-
🚀 实际应用场景
-
手机解锁:检测到人脸→提取特征→匹配机主
-
门禁系统:识别员工自动开门
-
相册整理:自动把奶奶的照片归类
-
会场签到:扫一眼就知道谁到场了
⚠️ 注意事项
-
光线问题:暗光下可能认不出(就像你看不清暗处的人脸)
-
双胞胎难题:长得太像可能分不清(需要更多细节特征)
-
戴口罩:遮住大半脸会困难(就像你认不出戴口罩的朋友)
🔧 如何提高准确率
-
更多照片:每人提供20张不同角度的照片
-
光线均衡:避免阴阳脸、背光脸
-
人脸对齐:把眼睛鼻子摆到标准位置再识别
-
更新相册:定期增加新照片(比如换了发型)
以下是完整代码演示
人脸检测部分(Viola-Jones算法)
% 创建人脸检测器
detector = vision.CascadeObjectDetector();
% 读取测试图像
img = imread('test_face.jpg');
% 检测人脸
bboxes = step(detector, img);
% 显示结果
detectedImg = insertObjectAnnotation(img, 'rectangle', bboxes, 'Face');
imshow(detectedImg);
title('Detected Faces');
人脸识别部分(HOG特征 + SVM分类器)
%% 数据集准备
% 假设数据集结构为:dataset/class/personXX_imYY.png
datasetPath = 'att_faces'; % ORL数据集路径
imds = imageDatastore(datasetPath, ...
'IncludeSubfolders', true, ...
'LabelSource', 'foldernames');
% 划分训练集和测试集(80%训练,20%测试)
[trainSet, testSet] = splitEachLabel(imds, 0.8, 'randomized');
%% 特征提取 - HOG
cellSize = [4 4]; % 特征单元尺寸
hogFeatureSize = 5184; % 根据图像大小计算得到
% 提取训练集HOG特征
trainFeatures = zeros(numel(trainSet.Files), hogFeatureSize, 'single');
for i = 1:numel(trainSet.Files)
img = readimage(trainSet, i);
img = im2gray(img);
trainFeatures(i, :) = extractHOGFeatures(img, 'CellSize', cellSize);
end
% 获取训练标签
trainLabels = trainSet.Labels;
%% 训练多类SVM分类器
classifier = fitcecoc(trainFeatures, trainLabels);
%% 测试集评估
testFeatures = zeros(numel(testSet.Files), hogFeatureSize, 'single');
for i = 1:numel(testSet.Files)
img = readimage(testSet, i);
img = im2gray(img);
testFeatures(i, :) = extractHOGFeatures(img, 'CellSize', cellSize);
end
testLabels = testSet.Labels;
predictedLabels = predict(classifier, testFeatures);
% 计算准确率
accuracy = sum(predictedLabels == testLabels) / numel(testLabels);
fprintf('识别准确率: %.2f%%\n', accuracy * 100);
% 显示混淆矩阵
confMat = confusionmat(testLabels, predictedLabels);
figure;
confusionchart(confMat);
title('混淆矩阵');
完整人脸检测+识别流程
% 1. 加载预训练模型
load('faceRecognitionModel.mat'); % 包含classifier和hog参数
% 2. 读取测试图像
testImg = imread('group_photo.jpg');
% 3. 人脸检测
detector = vision.CascadeObjectDetector();
bboxes = detector(testImg);
% 4. 对每个检测到的人脸进行识别
recognizedImg = testImg;
for i = 1:size(bboxes, 1)
% 裁剪人脸区域
face = imcrop(testImg, bboxes(i, :));
% 预处理
faceGray = im2gray(face);
faceResized = imresize(faceGray, [112 92]); % ORL数据集尺寸
% 提取HOG特征
features = extractHOGFeatures(faceResized, 'CellSize', cellSize);
% 预测标签
label = predict(classifier, features);
% 标记结果
recognizedImg = insertObjectAnnotation(recognizedImg, ...
'rectangle', bboxes(i, :), char(label), ...
'FontSize', 16, 'TextBoxOpacity', 0.8);
end
% 显示最终结果
figure;
imshow(recognizedImg);
title('人脸识别结果');
技能点实现说明
-
Viola-Jones人脸检测
-
使用
vision.CascadeObjectDetector
实现 -
基于Haar级联分类器,适合实时检测
-
-
HOG特征提取
-
extractHOGFeatures
函数提取梯度方向直方图 -
参数
CellSize
控制特征粒度(常用[4×4]或[8×8])
-
-
SVM分类器
-
使用
fitcecoc
训练多类SVM(支持向量机) -
ECOC(Error-Correcting Output Codes)处理多分类问题
-
-
模型评估
-
混淆矩阵可视化分类性能
-
计算测试集准确率
-
优化方向
-
添加人脸对齐预处理
-
尝试LBP特征替代HOG:
extractLBPFeatures
-
使用深度学习模型(AlexNet/ResNet迁移学习)
% 迁移学习示例
net = alexnet;
layers = net.Layers(1:end-3);
layers(end+1) = fullyConnectedLayer(numClasses);
layers(end+1) = softmaxLayer();
layers(end+1) = classificationLayer();
注意事项
-
训练前统一图像尺寸(建议与ORL数据集一致)
-
光照归一化可提升识别率
-
人脸检测阶段可添加
MergeThreshold
参数调整灵敏度
相关文章:
MATLAB实战:人脸检测与识别实现方案
我们要用电脑识别照片或视频中的人脸,并知道是谁的脸。就像手机相册能自动识别照片里的人是谁一样。 🔍 人脸检测(找脸) 目标:在图片中找到人脸的位置 怎么做: 用MATLAB的"人脸扫描仪"ÿ…...

深度刨析树结构(从入门到入土讲解AVL树及红黑树的奥秘)
目录 树的表示 二叉树的概念及结构(重点学习) 概念 : 特点: 树与非树 特殊的二叉树 二叉树的性质(重点) 二叉树的存储结构 堆的概念及结构 建堆方式: 向下调整算法 向上调整算法 建堆第一步初始化 建…...

【Linux】shell的条件判断
目录 一.使用逻辑运算符判定命令执行结果 二.条件判断方法 三.判断表达式 3.1文件判断表达式 3.2字符串测试表达式 3.3整数测试表达式 3.4逻辑操作符 一.使用逻辑运算符判定命令执行结果 && 在命令执行后如果没有任何报错时会执行符号后面的动作|| 在命令执行后…...

第九天:java注解
注解 1 什么是注解(Annotation) public class Test01 extends Object{//Override重写的注解Overridepublic String toString() {return "Test01{}";} }2 内置注解 2.1 Override Override重写的注解 Override public String toString() {ret…...

十一、【核心功能篇】测试用例管理:设计用例新增编辑界面
【核心功能篇】测试用例管理:设计用例新增&编辑界面 前言准备工作第一步:创建测试用例相关的 API 服务 (src/api/testcase.ts)第二步:创建测试用例编辑页面组件 (src/views/testcase/TestCaseEditView.vue)第三步:配置测试用例…...
react-native的token认证流程
在 React Native 中实现 Token 认证是移动应用开发中的常见需求,它用于验证用户的身份并授权其访问受保护的 API 资源。 Token 认证的核心流程: 用户登录 (Login): 用户在前端输入用户名和密码。前端将这些凭据发送到后端 API。后端验证凭据。如果验证成…...
ERP系统中商品定价功能设计:支持渠道、会员与批发场景的灵活定价机制
在现代零售、批发与电商环境下,商品的定价策略日益复杂。一个优秀的ERP系统不仅需要管理商品基础信息、库存与订单,还必须提供一套灵活且可扩展的商品定价机制,以满足: 不同销售渠道(如线上平台、线下门店、分销商&…...

Spring是如何实现属性占位符解析
Spring属性占位符解析 核心实现思路1️⃣ 定义占位符处理器类2️⃣ 处理 BeanDefinition 中的属性3️⃣ 替换具体的占位符4️⃣ 加载配置文件5️⃣ Getter / Setter 方法 源码见:mini-spring 在使用 Spring 框架开发过程中,为了实现配置的灵活性…...
数据结构之ArrayList
系列文章目录 目录 系列文章目录 前言 一、数据结构的前置语法 1. 时空复杂度 2. 包装类 3. 泛型 二、ArrayList 和顺序表 1. 顺序表的模拟实现 2. 源码 3. ArrayList 的优缺点 前言 本文介绍数据结构的前置算法,以及 ArrayList 的模拟实现,部…...

DDR4读写压力测试
1.1测试环境 1.1.1整体环境介绍 板卡: pcie-403板卡 主控芯片: Xilinx xcvu13p-fhgb2104-2 调试软件: Vivado 2018.3 代码环境: Vscode utf-8 测试工程: pcie403_user_top 1.1.2硬件介绍 UD PCIe-403…...
uniapp 开发企业微信小程序时,如何在当前页面真正销毁前或者关闭小程序前调用一个api接口
在 UniApp 开发企业微信小程序时,若需在页面销毁或小程序关闭前调用 API 接口,需结合页面生命周期和应用生命周期实现。以下是具体实现方案及注意事项: 一、在页面销毁前调用 API(页面级) 通过页面生命周期钩子 onUnl…...
WPF 按钮点击音效实现
WPF 按钮点击音效实现 下面我将为您提供一个完整的 WPF 按钮点击音效实现方案,包含多种实现方式和高级功能: 完整实现方案 MainWindow.xaml <Window x:Class"ButtonClickSound.MainWindow"xmlns"http://schemas.microsoft.com/win…...

编写测试用例
测试用例(Test Case)是用于测试系统的要素集合 目录 编写测试用例作用 编写测试用例要包含七大元素 测试用例的设计方法 1、等价类法 2、边界值法 3、正交表法 4、判定表法 5、错误推测法 6、场景法 编写测试用例作用 1、确保功能全面覆盖…...
解释程序(Python)不需要生成机器码 逐行解析 逐行执行
在计算机组成原理中,解释程序(Interpreter)通常不会生成独立的机器码,但具体情况取决于解释器的实现方式。以下是详细分析: 1. 传统解释程序:不生成机器码 直接逐行执行: 经典的解释器ÿ…...

每日Prompt:隐形人
提示词 黑色棒球帽,白色抹胸、粉色低腰短裙、白色襪子,黑色鞋子,粉紅色背包,衣服悬浮在空中呈现动态姿势,虚幻引擎渲染风格,高清晰游戏CG质感,户外山林背景,画面聚焦在漂浮的衣服上…...

TensorFlow深度学习实战(19)——受限玻尔兹曼机
TensorFlow深度学习实战(19)——受限玻尔兹曼机 0. 前言1. 受限玻尔兹曼机1.1 受限玻尔兹曼机架构1.2 受限玻尔兹曼机的数学原理 2. 使用受限玻尔兹曼机重建图像3. 深度信念网络小结系列链接 0. 前言 受限玻尔兹曼机 (Restricted Boltzmann Machine, RB…...

告别手动绘图!基于AI的Smart Mermaid自动可视化图表工具搭建与使用指南
以下是对Smart Mermaid的简单介绍: 一款基于 AI 技术的 Web 应用程序,可将文本内容智能转换为 Mermaid 格式的代码,并将其渲染成可视化图表可以智能制作流程图、序列图、甘特图、状态图等等,并且支持在线调整、图片导出可以Docke…...

【Oracle】安装单实例
个人主页:Guiat 归属专栏:Oracle 文章目录 1. 安装前的准备工作1.1 硬件和系统要求1.2 检查系统环境1.3 下载Oracle软件 2. 系统配置2.1 创建Oracle用户和组2.2 配置内核参数2.3 配置用户资源限制2.4 安装必要的软件包 3. 目录结构和环境变量3.1 创建Ora…...
C++测开,自动化测试,业务(第一段实习)
目录 🌼前言 一,实习经历怎么写简历 🌹业务理解 🎂结构化表达 二,实习 🦂技术和流程卡点 🔑实习收获 / 代码风格 三,测试理论,用例设计,工具链 &…...

QT中更新或添加组件时出现“”qt操作至少需要一个处于启用状态的有效资料档案库“解决方法”
在MaintenanceTool.exe中点击下一步 第一个: 第二个: 第三个: 以上任意一个放入资料库中...

论文速读《UAV-Flow Colosseo: 自然语言控制无人机系统》
论文链接:https://arxiv.org/abs/2505.15725项目主页:https://prince687028.github.io/UAV-Flow/ 0. 简介 近年来,无人机技术蓬勃发展,但如何让无人机像智能助手一样理解并执行人类语言指令,仍是一个前沿挑战。现有研…...

ES6+中Promise 中错误捕捉详解——链式调用catch()或者async/await+try/catch
通过 unhandledrejection 捕捉未处理的 Promise 异常,手动将其抛出,最终让 window.onerror 捕捉,从而统一所有异常的处理逻辑 规范代码:catch(onRejected)、async...awaittry...catch 在 JavaScript 的 Pro…...
CDN安全加速:HTTPS加密最佳配置方案
CDN安全加速的HTTPS加密最佳配置方案需从证书管理、协议优化、安全策略到性能调优进行全链路设计,以下是核心实施步骤与注意事项: 一、证书配置与管理 证书选择与格式 证书类型:优先使用受信任CA机构颁发的DV/OV/EV证…...

解常微分方程组
Euler法 function euler_method % 参数设置 v_missile 450; % 导弹速度 km/h v_enemy 90; % 敌艇速度 km/h % 初始条件 x0 0; % 导弹初始位置 x y0 0; % 导弹初始位置 y xe0 120; % 敌艇初始位置 y t0 0; % 初始时间 % 时间步长和总时间 dt 0.01; % 时间步长 t_final …...

C++实现汉诺塔游戏自动完成
目录 一、汉诺塔的规则二、数学递归推导式三、步骤实现(一)汉诺塔模型(二)递归实现(三)显示1.命令行显示2.SDL图形显示 四、处理用户输入及SDL环境配置五、总结六、源码下载 一、汉诺塔的规则 游戏由3根柱子和若干大小不一的圆盘组成,初始状态下,所有的…...
在 ABP VNext 中集成 Serilog:打造可观测、结构化日志系统
🚀 在 ABP VNext 中集成 Serilog:打造可观测、结构化日志系统 📚 目录 🚀 在 ABP VNext 中集成 Serilog:打造可观测、结构化日志系统1. 为什么要使用结构化日志? 🤔2. 核心集成步骤 Ὦ…...

pikachu靶场通关笔记07 XSS关卡03-存储型XSS
目录 一、XSS 二、存储型XSS 三、源码分析 四、渗透实战 1、输入mooyuan试一试 2、注入Payload 3、查看数据库 4、再次进入留言板页面 本系列为通过《pikachu靶场通关笔记》的XSS关卡(共10关)渗透集合,通过对XSS关卡源码的代码审计找到XSS风险的…...
GitLab CI、GitHub Actions和Jenkins进行比较
特性/工具JenkinsGitLab CIGitHub Actions架构设计哲学Master/Agent分布式架构,通过插件扩展功能代码与CI/CD强耦合,内置Git仓库,基于Runner注册机制事件驱动,与GitHub深度集成,基于虚拟机的Job执行单元核心运行机制支…...
strcat及其模拟实现
#define _CRT_SECURE_NO_WARNINGS strcat 追加字符串 str "string"(字符串) cat "concatenate"(连接 / 追加) char* strcat(char* destination, const char* source); strcat的应用 方法一ÿ…...

OpenCV CUDA模块直方图计算------用于在 GPU 上执行对比度受限的自适应直方图均衡类cv::cuda::CLAHE
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 cv::cuda::CLAHE 是 OpenCV 的 CUDA 模块中提供的一个类,用于在 GPU 上执行对比度受限的自适应直方图均衡(Contrast Limi…...