当前位置: 首页 > article >正文

OpenCV 实现人脸识别:LBPH/Eigen/Fisher 三大算法实战详解

在人工智能飞速发展的今天人脸识别已经成为我们生活中无处不在的技术 —— 手机解锁、刷脸支付、门禁考勤、安防监控等场景都离不开人脸识别技术的支撑。对于 Python 开发者而言OpenCV 库提供了开箱即用的人脸识别接口无需深入底层算法原理就能快速实现简易的人脸检测与识别功能。本文将基于 OpenCV 库手把手带你实现LBPH、EigenFace、FisherFace三种经典的人脸识别算法从环境搭建、数据准备、代码编写到效果测试全程实战讲解。同时解决 OpenCV 原生不支持中文标注的痛点实现中文识别结果可视化展示。无论你是 Python 初学者还是计算机视觉入门爱好者都能通过本文快速掌握人脸识别的基础实现方法。一、环境准备与核心库介绍1.1 核心库与算法原理OpenCV开源计算机视觉库内置了三种经典的静态人脸识别算法无需训练复杂模型适合轻量级人脸识别场景NumPyPython 数值计算基础库用于处理图像数据的数组转换满足算法训练的数据格式要求PILPython 图像处理库弥补 OpenCV 无法直接绘制中文的缺陷实现识别结果中文标注三大人脸识别算法核心区别LBPH局部二值模式直方图基于局部纹理特征对光照、姿态变化鲁棒性强支持任意尺寸图像是最常用的人脸识别算法EigenFace特征脸基于主成分分析PCA将人脸降维为特征向量计算速度快但对图像尺寸、光照要求严格FisherFace费舍尔脸基于线性判别分析LDA在 EigenFace 基础上优化了分类能力区分不同人脸的效果更优同样要求图像尺寸统一。二、数据集准备人脸识别的第一步是准备训练数据我们采用二分类人脸数据集区分迪丽热巴和杨幂两位人物数据集结构如下train_data/ ├─ 0/ # 标签0迪丽热巴 │ ├─ rb.png │ ├─ rb1.png │ └─ rb2.png └─ 1/ # 标签1杨幂 ├─ ym1.png ├─ ym2.png └─ ym3.png数据集要求所有图片均为灰度图像人脸识别算法对灰度图处理效率更高EigenFace 和 FisherFace 算法要求所有训练图像、预测图像尺寸完全一致图片中仅包含单一人脸无过多背景干扰保证识别准确率。小贴士建议提前用截图工具裁剪人脸区域剔除多余背景提升识别准确率。三、算法一LBPH 人脸识别实现LBPH 是 OpenCV 中最灵活、最易用的人脸识别算法无需统一图像尺寸对环境适应性最强适合入门首选。3.1 完整代码实现# 导入依赖库 import cv2 import numpy as np # 1. 加载训练图像与标签 # 定义空列表存储训练图像 images [] # 以灰度模式读取迪丽热巴的人脸图片标签0 images.append(cv2.imread(train_data/0/rb.png, cv2.IMREAD_GRAYSCALE)) images.append(cv2.imread(train_data/0/rb1.png, cv2.IMREAD_GRAYSCALE)) # 以灰度模式读取杨幂的人脸图片标签1 images.append(cv2.imread(train_data/1/ym1.png, cv2.IMREAD_GRAYSCALE)) images.append(cv2.imread(train_data/1/ym2.png, cv2.IMREAD_GRAYSCALE)) # 定义标签与图像一一对应0迪丽热巴1杨幂 labels [0, 0, 1, 1] # 定义结果映射字典 dic {0: 迪丽热巴, 1: 杨幂, -1: 无法识别} # 2. 加载待预测的图像 predict_img cv2.imread(train_data/1/ym3.png, cv2.IMREAD_GRAYSCALE) # 3. 初始化LBPH人脸识别器 # threshold置信度阈值超过该值则判定为无法识别 recognizer cv2.face.LBPHFaceRecognizer_create(threshold80) # 4. 训练模型 # 传入训练图像列表和标签数组需转换为numpy数组 recognizer.train(images, np.array(labels)) # 5. 执行预测 # 返回值预测标签、置信度 label, confidence recognizer.predict(predict_img) # 6. 输出结果 print(识别结果, dic[label]) print(置信度, confidence)3.2 代码核心解析图像读取cv2.IMREAD_GRAYSCALE表示以灰度模式读取图像这是人脸识别的标准格式标签定义标签必须是整数类型与训练图像一一对应保证模型训练的准确性LBPH 初始化threshold为置信度阈值数值越小识别越严格超过阈值则返回 - 1无法识别模型训练train()方法接收图像列表和 numpy 格式的标签数组完成模型训练预测结果predict()回预测标签和置信度置信度数值越小识别结果越准确。3.3 运行结果置信度 76.9001532691603 小于阈值 80识别成功结果准确。四、算法二EigenFace 人脸识别实现EigenFace 是基于降维思想的人脸识别算法必须保证所有图像尺寸完全一致计算速度快适合对性能要求高的场景。4.1 完整代码实现import cv2 import numpy as np # 1. 统一图像尺寸并加载训练数据 images [] # 读取图像并resize为统一尺寸(120,100) a cv2.imread(train_data/0/rb1.png, 0) # 0等价于IMREAD_GRAYSCALE a cv2.resize(a, (120, 100)) images.append(a) b cv2.imread(train_data/0/rb2.png, 0) b cv2.resize(b, (120, 100)) images.append(b) c cv2.imread(train_data/1/ym3.png, 0) c cv2.resize(c, (120, 100)) images.append(c) d cv2.imread(train_data/1/ym2.png, 0) d cv2.resize(d, (120, 100)) images.append(d) # 定义标签 labels [0, 0, 1, 1] # 2. 加载并预处理预测图像尺寸必须与训练图一致 pre_image cv2.imread(train_data/1/ym1.png, 0) pre_image cv2.resize(pre_image, (120, 100)) # 3. 初始化EigenFace识别器 recognizer cv2.face.EigenFaceRecognizer_create(threshold5000) # 4. 训练与预测 recognizer.train(images, np.array(labels)) label, confidence recognizer.predict(pre_image) # 5. 结果映射与输出 dic {0: 迪丽热巴, 1: 杨幂, -1: 无法识别} print(识别结果, dic[label]) print(置信度, confidence) # 6. 可视化结果在原图上标注识别结果 img cv2.imread(train_data/1/ym1.png).copy() # 添加英文文字OpenCV原生不支持中文 result_img cv2.putText(img, ym, (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.9, (0, 0, 255), 2) # 显示图像 cv2.imshow(xx, result_img) cv2.waitKey(0) # 按下任意键关闭窗口4.2 核心注意事项尺寸统一EigenFace 算法强制要求所有图像尺寸相同必须使用cv2.resize()预处理阈值设置EigenFace 的置信度数值较大阈值通常设置为 5000 左右中文限制OpenCV 原生putText函数不支持中文会显示为乱码本文后续会解决该问题。4.3 运行效果控制台输出识别结果弹窗显示带标注的人脸图像直观展示识别效果。五、算法三FisherFace 人脸识别 中文标注实现FisherFace 是 EigenFace 的优化版本分类能力更强同样要求图像尺寸统一。同时我们通过 PIL 库解决OpenCV 中文标注乱码问题实现专业的可视化效果。5.1 中文标注核心函数OpenCV 无法直接绘制中文我们封装cv2AddChineseText函数实现中文文字绘制from PIL import Image, ImageDraw, ImageFont def cv2AddChineseText(img, text, position, textColor(0, 255, 0), textSize30): OpenCV图像添加中文文字 :param img: OpenCV读取的图像 :param text: 中文文字内容 :param position: 文字位置(x,y) :param textColor: 文字颜色(RGB) :param textSize: 文字大小 :return: 带中文的OpenCV图像 # 判断是否为OpenCV图像numpy数组 if isinstance(img, np.ndarray): # 转换为PIL图像格式 img Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB)) # 创建绘图对象 draw ImageDraw.Draw(img) # 设置字体宋体支持中文 fontStyle ImageFont.truetype(simsun.ttc, textSize, encodingutf-8) # 绘制中文 draw.text(position, text, textColor, fontfontStyle) # 转换回OpenCV图像格式 return cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR)5.2 FisherFace 完整代码import cv2 import numpy as np from PIL import Image, ImageDraw, ImageFont # 中文标注函数同上 def cv2AddChineseText(img, text, position, textColor(0, 255, 0), textSize30): if isinstance(img, np.ndarray): img Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB)) draw ImageDraw.Draw(img) fontStyle ImageFont.truetype(simsun.ttc, textSize, encodingutf-8) draw.text(position, text, textColor, fontfontStyle) return cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR) # 封装图像加载与预处理函数 def image_preprocess(image_path, image_list): # 读取灰度图 img cv2.imread(image_path, 0) # 统一尺寸120x180 img cv2.resize(img, (120, 180)) image_list.append(img) # 1. 加载训练数据 images [] image_preprocess(train_data/0/rb1.png, images) image_preprocess(train_data/0/rb2.png, images) image_preprocess(train_data/1/ym1.png, images) image_preprocess(train_data/1/ym2.png, images) labels [0, 0, 1, 1] # 2. 预处理预测图像 pre_image cv2.imread(train_data/1/ym3.png, 0) pre_image cv2.resize(pre_image, (120, 180)) # 3. 初始化FisherFace识别器 recognizer cv2.face.FisherFaceRecognizer_create(threshold5000) # 4. 训练与预测 recognizer.train(images, np.array(labels)) label, confidence recognizer.predict(pre_image) # 5. 结果处理 dic {0: 迪丽热巴, 1: 杨幂, -1: 无法识别} print(识别结果, dic[label]) print(置信度, confidence) # 6. 中文可视化 original_img cv2.imread(train_data/1/ym3.png).copy() # 添加中文标注 result_img cv2AddChineseText(original_img, dic[label], (30, 10), textColor(255, 0, 0), textSize40) # 显示最终效果 cv2.imshow(xx, result_img) cv2.waitKey(0)5.3 核心亮点函数封装将图像预处理封装为函数代码更简洁、复用性更强中文标注完美解决 OpenCV 中文乱码问题展示专业的识别效果算法优化FisherFace 相比 EigenFace对相似人脸的区分能力更优准确率更高。六、三大算法对比与总结6.1 算法性能对比表算法图像尺寸要求光照适应性计算速度适用场景LBPH无要求强中等通用场景、入门首选EigenFace必须统一弱快性能优先、环境固定场景FisherFace必须统一中等中等高精度分类场景6.2 关键知识点总结图像格式人脸识别优先使用灰度图减少计算量提升效率置信度规则三种算法的置信度数值越小识别结果越准确阈值调整LBPH 阈值建议 50-100EigenFace/FisherFace 建议 5000 左右中文解决方案通过 PIL 库转换图像格式实现 OpenCV 中文标注数据集优化人脸裁剪越精准、背景越干净识别准确率越高。七、拓展与进阶方向本文实现的是静态人脸识别基于本地图片完成训练与预测在此基础上你可以进一步拓展实时人脸识别调用电脑摄像头实现实时人脸检测与识别多分类识别增加更多人物标签实现多人脸识别人脸检测预处理结合cv2.CascadeClassifier实现自动人脸裁剪模型保存将训练好的模型保存为.xml 文件无需重复训练深度学习人脸识别基于 MTCNN、FaceNet 等深度学习模型实现高精度识别。结语本文通过三段实战代码详细讲解了 OpenCV 中 LBPH、EigenFace、FisherFace 三种人脸识别算法的实现方法从环境搭建、数据准备到代码优化、中文可视化覆盖了人脸识别的全流程。OpenCV 让人脸识别技术变得触手可及即使是零基础的开发者也能快速实现属于自己的人脸识别程序。人脸识别是计算机视觉领域的经典应用掌握基础算法后你可以逐步深入深度学习领域探索更强大的视觉技术。希望本文能为你的计算机视觉学习之路打下坚实的基础动手实践起来感受人工智能的魅力

相关文章:

OpenCV 实现人脸识别:LBPH/Eigen/Fisher 三大算法实战详解

在人工智能飞速发展的今天,人脸识别已经成为我们生活中无处不在的技术 —— 手机解锁、刷脸支付、门禁考勤、安防监控等场景,都离不开人脸识别技术的支撑。对于 Python 开发者而言,OpenCV 库提供了开箱即用的人脸识别接口,无需深入…...

3步永久解锁加密PDF:ScienceDecrypting终极使用指南

3步永久解锁加密PDF:ScienceDecrypting终极使用指南 【免费下载链接】ScienceDecrypting 破解CAJViewer带有效期的文档,支持破解科学文库、标准全文数据库下载的文档。无损破解,保留文字和目录,解除有效期限制。 项目地址: http…...

SEO工具如何提供网站的整体优化建议

SEO工具如何提供网站的整体优化建议 在当今竞争激烈的互联网市场中,网站的整体优化是每一个企业和个人网站的重要任务。SEO工具在这一过程中扮演着不可或缺的角色。SEO工具如何提供网站的整体优化建议呢?本文将从问题分析、原因说明、解决方法、注意事项…...

告别GitHub访问难题:Fast-GitHub让开发效率提升300%

告别GitHub访问难题:Fast-GitHub让开发效率提升300% 【免费下载链接】Fast-GitHub 国内Github下载很慢,用上了这个插件后,下载速度嗖嗖嗖的~! 项目地址: https://gitcode.com/gh_mirrors/fa/Fast-GitHub 你是否也曾经历过这…...

3大突破!微信聊天记录数据导出与备份终极指南:从困境到掌控

3大突破!微信聊天记录数据导出与备份终极指南:从困境到掌控 【免费下载链接】WeChatExporter 一个可以快速导出、查看你的微信聊天记录的工具 项目地址: https://gitcode.com/gh_mirrors/wec/WeChatExporter 微信聊天记录承载着我们生活与工作中的…...

六通道HDMI/网络/文件混用一体录播机

——H.265硬编、16T存储、8方互动、智能导播,每个通道都能“按需切换” 它到底是什么? WHT-6H是一台6通道全高清录播主机,每个通道都可以在三种信号源之间自由切换: HDMI信号(4路物理接口,最高1080P60&am…...

016、CI/CD流水线:用GitHub Actions把部署从玄学变成肌肉记忆

016、CI/CD流水线:用GitHub Actions把部署从玄学变成肌肉记忆 上周深夜,线上服务突然告警。紧急回滚时发现,测试环境通过的镜像在生产环境死活起不来。查了三个小时,最后发现是某位同事在Dockerfile里写死了测试数据库的IP。这种“…...

卡诺图简化逻辑函数详解

你提供的图片是数字逻辑电路教材中关于**卡诺图(Karnaugh Map)**的内容,主要讲解如何用卡诺图表示和化简逻辑函数。下面我为你逐部分解释:📌 一、核心概念:什么是卡诺图?卡诺图是一种图形化工具…...

Ai2Psd终极指南:如何将Illustrator矢量图层完美导出到Photoshop

Ai2Psd终极指南:如何将Illustrator矢量图层完美导出到Photoshop 【免费下载链接】ai-to-psd A script for prepare export of vector objects from Adobe Illustrator to Photoshop 项目地址: https://gitcode.com/gh_mirrors/ai/ai-to-psd 还在为AI到PSD的格…...

AI CRM 2.0时代:SaaS厂商的生死局

今天的SaaS厂商,要么彻底重构底层架构,要么被时代抛弃。原创:首席数智官 封面:AI“未来每一家SaaS公司都会成为AaaS(Agentic as a Service)公司。”这是英伟达创始人、CEO黄仁勋在GTC 2026演讲中给出的判断…...

代购系统技术实现:如何高效采集 1688 和淘宝商品数据

# 代购系统技术实现:如何高效采集 1688 和淘宝商品数据在跨境电商和代购业务中,高效采集 1688 和淘宝商品数据是核心痛点。本文分享我们在 taocarts 代购系统中的技术实践。## 一、数据采集架构设计我们采用分布式爬虫架构,核心模块包括&…...

实战部署JetBrains IDE试用期重置:自动化清理与插件开发全流程

实战部署JetBrains IDE试用期重置:自动化清理与插件开发全流程 【免费下载链接】ide-eval-resetter 项目地址: https://gitcode.com/gh_mirrors/id/ide-eval-resetter JetBrains IDE试用期重置工具是一个开源项目,专门用于清除IntelliJ IDEA、Py…...

定制化水源热泵技术,实现低品位余热高效捕获

低品位余热的高效回收利用,核心在于能否打造出适配水源特性与工况需求的核心热泵机组,只有实现对余热资源的精准捕获,才能真正将闲置余热转化为可利用的清洁能源。针对鲁西南矿区的水源特性与极端气候工况,瑞冬为当地某铁矿项目针…...

【西工大主办、连续多届稳定检索】第七届机械仪表与自动化国际学术会议(ICMIA 2026)

2026年第七届机械仪表与自动化国际学术会议(ICMIA 2026)定于2026年6月26-28日在中国成都隆重举行。随着科学技术的不断发展和工业化的加速,现代工业生产的自动化程度越来越高。而机械仪表自动化作为现代工业控制的重要组成部分,其…...

游戏脚本助手,电脑点击器,脚本自动点击识图找图_无限试用版

熊猫精灵脚本助手 分类功能项其他功能管理、插件、生成、中控、进程守护、护盾配置、坐标工具脚本设置窗口设置、绑定设置、运行设置、变量设置、程序设置图色识别Yolo识别、找图识别、点色找色文字识别ocr识别找字、字库识别、验证码识别键鼠操作鼠标操作、键盘操作、录制脚本…...

网站爬虫原理,基于浏览器点击行为还原可接口请求

爬虫这个词细节来说本质只有一件事,把浏览器发出的请求,换一种方式再发一遍 问题不是怎么发请求,而是: 请求是怎么构造的参数从哪里来的哪些字段不能少从一个点击动作开始 打开一个网站,例如一个列表页。 执行一个动作…...

Tree-sitter解析代码

Tree-sitter 语法树 到底是什么、长什么样、包含什么东西。一、通俗解释Tree-sitter 会把一行行代码,解析成一棵结构化的「语法树」(像家族树一样有层级、有分类),让机器能看懂代码的结构(哪个是方法、哪个是方法名、哪…...

毕业设计作品精选【芳芯科技】酒驾检测座椅设计

实物效果图:实现功能:有人的情况下,单片机实时采集周围的酒精浓度,如果超出,蜂鸣器报警,LED闪烁。检测座位重量和检测人体发射的红外,两者都满足认为座位有人,否则无人。配有显示屏进…...

如何打造专属漫画体验?Venera主题定制全攻略

如何打造专属漫画体验?Venera主题定制全攻略 【免费下载链接】venera A comic app 项目地址: https://gitcode.com/gh_mirrors/ve/venera 核心价值:为什么要定制Venera主题? 在数字阅读时代,个性化体验已成为提升用户满意…...

Oracle里的MINUS是什么

在 Oracle 中,MINUS 是 SQL 中的一个集合操作符,它用于比较两个查询的结果集,并返回第一个查询中有而第二个查询中没有的不重复记录。 核心概念 MINUS 执行的是集合的“差集”操作。你可以把它想象成数学中的减法:结果集A - 结果集…...

7大能力解锁:让浏览器成为你的全能Markdown工作站

7大能力解锁:让浏览器成为你的全能Markdown工作站 【免费下载链接】markdown-viewer Markdown Viewer / Browser Extension 项目地址: https://gitcode.com/gh_mirrors/ma/markdown-viewer 据开发者生态调研显示,超过90%的技术文档工作者面临本地…...

储能变流器双向软开关设计:从拓扑选型到控制策略的工程实现

一、储能PCS的技术挑战与设计目标1.1 储能系统的核心需求储能变流器(PCS)是实现电池与电网之间能量双向流动的关键设备,在充电模式下将电网交流电转换为直流电为电池充电,在放电模式下将电池直流电转换为交流电馈入电网或供给负载…...

TA6585替代品6586直流双向电机驱动芯片详解

在电机驱动领域,芯片的性能、稳定性与适配性决定着设备的运行效果与使用寿命。6586作为TA6585的替代品,是一款高性能直流双向电机驱动芯片,凭借其小巧的封装、全面的保护功能及广泛的适配场景,替代TA6585,成为玩具、智…...

MogFace-large效果对比:在遮挡/小脸/密集场景下超越YOLOv8与RetinaFace实测

MogFace-large效果对比:在遮挡/小脸/密集场景下超越YOLOv8与RetinaFace实测 1. 引言:人脸检测的现实挑战 在实际应用中,人脸检测面临着三大难题:遮挡、小脸和密集场景。当人脸被口罩、眼镜或其他人遮挡时,传统检测器…...

实战分享:WAN2.2文生视频结合SDXL风格,用Python打造自动化视频生产线

实战分享:WAN2.2文生视频结合SDXL风格,用Python打造自动化视频生产线 1. 为什么选择WAN2.2SDXL组合进行视频创作 在数字内容爆炸式增长的今天,视频创作已经成为各行各业的基本需求。但传统视频制作流程复杂、成本高昂,让许多创作…...

千问3.5-2B在内容审核中的应用:自动识别敏感图文组合,降低人工复核成本

千问3.5-2B在内容审核中的应用:自动识别敏感图文组合,降低人工复核成本 1. 内容审核的挑战与机遇 每天,互联网上产生数以亿计的图文内容,如何高效识别其中的敏感信息成为平台运营者的重大挑战。传统人工审核方式面临三大痛点&am…...

保姆级教程:用国产龙虾AiPy自己打造全链路写文到一键发布

近期在探索 AI 自动化办公场景,尝试通过智能体工具自主构建功能插件,实现从内容创作、图文排版到公众号上传发布的全流程自动化,同时搭配远程控制功能,实现户外离线指令触发、电脑端自动执行,大幅降低自媒体日更的操作…...

连锁经营行业商旅平台选型指南与测评排名Top 6:多门店与全链路商旅管控方案

2026年4月的第一周,艾美咨询发布了《2026年中国连锁经营行业商旅管理数字化白皮书》,数据显示国内规模以上连锁经营企业的商旅支出占整体运营成本的8.7%,其中私车公用、门店巡检类商旅的合规漏洞造成的浪费占总商旅支出的19.2%,连…...

构筑可信电子签名签章体系,亲笔签助力黔江区公立医院改革与高质量发展

巍巍武陵山,滔滔阿蓬江,在渝东南这片热土上,一个关乎50余万群众健康福祉的数字变革正在发生。2022年,黔江区成为首批入选公立医院改革与高质量发展示范项目全国15个试点地区之一。从“看病难、看病远”的山区困境,到“…...

每日一题 力扣 3418. 机器人可以获得的最大金币数 力扣 215. 数组中的第K个最大元素 动态规划 TopK问题 C++ 题解

文章目录力扣 3418. 机器人可以获得的最大金币数题目描述思路简介代码实现复杂度分析力扣 215. 数组中的第K个最大元素题目描述思路简介代码实现复杂度分析踩坑记录力扣 3418. 机器人可以获得的最大金币数 题目描述 力扣 3418. 机器人可以获得的最大金币数 示例 1&#xff1…...