当前位置: 首页 > article >正文

从零上手!用 Python+OpenCV 实现 LBPH 人脸识别,小白也能跑通

一、写在前面人脸识别到底是什么你有没有好奇过手机的人脸解锁、门禁的刷脸开门到底是怎么认出你的其实核心逻辑很简单先 “记住” 人脸把你的多张照片喂给算法让它学习你的面部特征相当于给你建了一个 “人脸档案”再 “认出” 人脸用新的照片去和档案里的特征做对比找到最像的那个就完成了识别今天我们用LBPH局部二值模式直方图这个超适合新手的算法用 PythonOpenCV 从零实现一个人脸识别小项目全程代码可复制小白也能一步跑通二、先搞懂LBPH 到底是个啥不用怕复杂公式我们用大白话讲清楚 LBPH 的原理1. 核心思想把人脸变成 “特征直方图”LBPH 的本质是把一张人脸照片转换成一串能代表它特征的数字方便计算机对比LBP局部二值模式给人脸的每个像素点都和它周围的 8 个邻居比大小比它大就记 1小就记 0最后生成一个 8 位的二进制数相当于给这个像素打了个 “特征标签”PH直方图把整张脸分成 8×864 个小格子每个格子里统计所有像素的 LBP 标签出现的次数生成一个小直方图最终特征把 64 个小直方图拼起来就得到了这张人脸的 “专属特征串”相当于人脸的 “身份证”2. 为什么 LBPH 适合新手原理简单代码量少不用复杂的深度学习模型对光照、表情的小变化鲁棒性不错适合入门级人脸识别OpenCV 直接封装好了现成的 API不用自己从零实现算法三、环境准备3 步搞定开发环境1. 安装 Python如果还没装 Python直接去Python 官网File下载 3.9 及以上版本安装时记得勾选「Add Python to PATH」避免后续环境问题。2. 安装 OpenCV 和 NumPy打开电脑的命令提示符CMD输入下面两行命令一键安装依赖bash运行pip install opencv-python opencv-contrib-python numpyopencv-pythonOpenCV 主库用来处理图片、读取文件opencv-contrib-python包含 LBPH 人脸识别的扩展库numpy用来处理数组数据训练模型必须用3. 准备人脸图片我们需要两类图片训练集4 张2 张 A 的照片 2 张 B 的照片用来让算法 “记住” 两个人的脸比如hg1.png、hg2.pngA 的照片pyy1.png、pyy2.pngB 的照片测试集1 张1 张要识别的照片比如hg.pngA 的新照片⚠️关键注意事项所有图片必须和代码放在同一个文件夹里避免路径报错图片文件名必须和代码里写的完全一致包括大小写、后缀.png/.jpg尽量用灰度图或者让代码自动转灰度人脸尽量居中、清晰去掉多余背景四、完整代码逐行讲解小白直接复制下面是完整可运行的代码我会逐行解释每一步的作用你直接复制就能用python运行# 1. 导入需要的库 import cv2 # OpenCV库用来处理图片、人脸识别 import numpy as np # NumPy库用来处理数组数据 # # 2. 准备训练数据加载训练用的人脸照片 # # 创建一个空列表用来存所有训练图片 images [] # 用cv2.imread读取图片cv2.IMREAD_GRAYSCALE表示以灰度图读取 # 灰度图能减少计算量提升识别效率 images.append(cv2.imread(hg1.png, cv2.IMREAD_GRAYSCALE)) images.append(cv2.imread(hg2.png, cv2.IMREAD_GRAYSCALE)) images.append(cv2.imread(pyy1.png, cv2.IMREAD_GRAYSCALE)) images.append(cv2.imread(pyy2.png, cv2.IMREAD_GRAYSCALE)) # # 3. 给训练图片打标签对应每个人的身份 # # labels列表和images列表一一对应 # hg1、hg2对应标签0代表Apyy1、pyy2对应标签1代表B labels [0, 0, 1, 1] # 创建一个字典把标签转换成我们能看懂的名字 # -1代表无法识别的人脸 dic {0: hg, 1: pyy, -1: 无法识别} # # 4. 加载待识别的测试图片 # # 读取要识别的图片同样转成灰度图 predict_image cv2.imread(hg.png, cv2.IMREAD_GRAYSCALE) # # 5. 创建LBPH人脸识别器 # # cv2.face.LBPHFaceRecognizer_create() 是OpenCV封装好的LBPH识别器 # threshold80设置置信度阈值超过80就判定为“无法识别” recognizer cv2.face.LBPHFaceRecognizer_create(threshold80) # # 6. 训练模型让算法“记住”人脸 # # recognizer.train() 用来训练模型 # 第一个参数是训练图片列表第二个参数是标签数组必须用np.array转成数组格式 recognizer.train(images, np.array(labels)) # # 7. 执行识别对比特征输出结果 # # recognizer.predict() 用来识别新图片 # 返回两个值label识别到的标签、confidence置信度 label, confidence recognizer.predict(predict_image) # # 8. 打印识别结果 # print(这人是, dic[label]) print(置信度, confidence)五、代码运行常见报错 解决方法1. 最常见报错cant open/read file: check file path/integrity报错原因代码找不到你写的图片文件解决方法检查图片是否和代码在同一个文件夹检查文件名是否完全一致比如hg.png不要写成HG.png、hg.jpg可以用绝对路径避免问题比如python运行predict_image cv2.imread(rE:\py_flie\图像拼接\hg.png, cv2.IMREAD_GRAYSCALE)前面加r是为了避免转义字符问题直接复制路径即可2. 报错cv2.error: OpenCV(3.4.18) ... error: (-215:Assertion failed)报错原因图片读取失败为空后续识别无法执行解决方法先加一个图片检查的代码避免崩溃python运行if predict_image is None: print(错误无法读取待识别图片请检查文件路径和文件名) exit()确保图片没有损坏格式正确支持 png、jpg、jpeg 等常见格式3. 置信度 0.0是好事很多同学运行后会看到plaintext这人是 hg 置信度 0.0完全不用担心这是最完美的结果LBPH 的置信度规则数值越小匹配度越高0.0 代表待识别图片和训练集中的某张图片完全一模一样算法 100% 匹配正常用新照片识别置信度会在 20~60 之间超过 80 就会判定为 “无法识别”六、核心概念详解置信度到底是什么很多小白搞不懂置信度这里用一张表讲清楚表格置信度数值含义状态0.0待识别图片和训练图片完全一致100% 完美匹配1~70人脸特征高度相似匹配成功正常识别结果80特征差距大匹配度低接近阈值可能识别错误触发 - 1 标签置信度超过 threshold我们设的 80无法识别该人脸举个例子你用训练过的hg1.png去识别置信度就是 0.0完全一样用一张没训练过的hg3.pngA 的新照片去识别置信度大概 30 左右很像用一张陌生人的照片去识别置信度会超过 80输出 “无法识别”七、项目优化让识别更准确、更实用1. 优化训练数据每个人的训练照片越多5~10 张识别越准确训练照片尽量包含不同角度、不同光照、不同表情的人脸统一图片尺寸比如都 resize 成 200×200避免尺寸差异影响识别2. 调整识别阈值threshold80是默认推荐值你可以根据需求调整想更严格不容易认错人把阈值调低比如threshold60想更宽松更容易识别把阈值调高比如threshold1003. 增加人脸检测步骤现在的代码是直接用人脸照片识别实际场景中需要先从照片里检测出人脸再识别python运行# 加载OpenCV自带的人脸检测分类器 face_cascade cv2.CascadeClassifier(cv2.data.haarcascades haarcascade_frontalface_default.xml) # 检测人脸 faces face_cascade.detectMultiScale(predict_image, 1.1, 4) # 遍历检测到的人脸逐个识别 for (x, y, w, h) in faces: face_img predict_image[y:yh, x:xw] # 裁剪出人脸区域 label, confidence recognizer.predict(face_img) print(f检测到人脸{dic[label]}置信度{confidence})4. 保存和加载训练好的模型训练好的模型可以保存下来下次不用重新训练python运行# 保存模型 recognizer.save(lbph_model.yml) # 加载模型 recognizer.read(lbph_model.yml)八、写在最后人脸识别的拓展方向这个 LBPH 项目是人脸识别的入门级项目适合新手理解原理实际应用中还有很多进阶方向深度学习人脸识别用 FaceNet、MTCNN、ArcFace 等模型识别准确率更高适合复杂场景实时人脸识别结合摄像头实现实时人脸检测 识别比如门禁系统多人脸识别在一张照片里识别多个人的身份活体检测防止用照片、视频冒充人脸提升安全性九、完整优化版代码带错误检查直接用最后给你一个优化后的完整代码加了错误检查、路径判断小白直接复制就能跑python运行import cv2 import numpy as np import os # 配置区修改这里的文件名和路径 # 训练图片列表 train_img_names [hg1.png, hg2.png, pyy1.png, pyy2.png] # 对应标签0hg1pyy labels [0, 0, 1, 1] # 标签对应名字 name_dict {0: hg, 1: pyy, -1: 无法识别} # 待识别图片 test_img_name hg.png # 置信度阈值 threshold 80 # # 1. 加载训练图片 images [] for img_name in train_img_names: # 检查图片是否存在 if not os.path.exists(img_name): print(f错误训练图片 {img_name} 不存在请检查文件路径) exit() # 读取图片 img cv2.imread(img_name, cv2.IMREAD_GRAYSCALE) if img is None: print(f错误无法读取训练图片 {img_name}文件可能损坏) exit() images.append(img) # 2. 加载待识别图片 if not os.path.exists(test_img_name): print(f错误待识别图片 {test_img_name} 不存在请检查文件路径) exit() predict_image cv2.imread(test_img_name, cv2.IMREAD_GRAYSCALE) if predict_image is None: print(f错误无法读取待识别图片 {test_img_name}文件可能损坏) exit() # 3. 创建LBPH人脸识别器 recognizer cv2.face.LBPHFaceRecognizer_create(thresholdthreshold) # 4. 训练模型 recognizer.train(images, np.array(labels)) # 5. 执行识别 label, confidence recognizer.predict(predict_image) # 6. 输出结果 print(*50) print(f识别结果{name_dict[label]}) print(f置信度越小越匹配{round(confidence, 2)}) if confidence threshold: print(提示置信度超过阈值识别结果可能不准确) print(*50)常见问题 QAQ1为什么我的置信度很高识别错了A大概率是训练数据太少或者人脸角度、光照差异太大。增加训练照片数量统一拍摄环境就能提升准确率。Q2可以识别更多人吗A完全可以比如要识别 3 个人就给每个人加 2 张训练照片标签对应 0、1、2字典里加对应的名字即可。Q3LBPH 和深度学习人脸识别有什么区别ALBPH 是传统机器学习算法速度快、代码简单适合小场景、入门学习深度学习算法准确率更高适合复杂场景但需要更多数据和算力。如果你跟着教程跑通了或者遇到了其他问题欢迎在评论区留言交流

相关文章:

从零上手!用 Python+OpenCV 实现 LBPH 人脸识别,小白也能跑通

一、写在前面:人脸识别到底是什么?你有没有好奇过,手机的人脸解锁、门禁的刷脸开门,到底是怎么认出你的?其实核心逻辑很简单:先 “记住” 人脸:把你的多张照片喂给算法,让它学习你的…...

FLUX.1-dev像素艺术生成实战:像素幻梦在RPG地图设计中的落地应用

FLUX.1-dev像素艺术生成实战:像素幻梦在RPG地图设计中的落地应用 1. 像素艺术生成新纪元 在独立游戏开发领域,像素艺术始终保持着独特的魅力。传统像素画创作需要艺术家逐格绘制,耗时耗力。而基于FLUX.1-dev模型的像素幻梦(Pixel Dream Wor…...

无障碍技术实践:OpenClaw+Phi-3-vision-128k-instruct构建语音图文助手

无障碍技术实践:OpenClawPhi-3-vision-128k-instruct构建语音图文助手 1. 项目背景与动机 去年夏天,我在一次志愿者活动中遇到几位视障开发者。他们提到日常工作中最大的障碍不是编程本身,而是无法快速获取图像信息和处理文档内容。这让我开…...

终极指南:如何无需Steam客户端轻松下载创意工坊模组

终极指南:如何无需Steam客户端轻松下载创意工坊模组 【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 你是否曾因Steam客户端无法访问创意工坊而烦恼?或者…...

P4084 [USACO17DEC] Barn Painting G 题解

题目描述Farmer John 有一个大农场,农场上有 N 个谷仓(1≤N≤105),其中一些已经涂色,另一些尚未涂色。Farmer John 想要为这些剩余的谷仓涂色,使得所有谷仓都被涂色,但他只有三种可用的油漆颜色…...

Claude颠覆AI编程

🚀 Claude 4 正式发布!Anthropic 这次真的要颠覆 AI 编程了 今天,AI 领域迎来核弹级更新——Anthropic 正式发布 Claude 4 系列模型!免费可用、7 小时自主编程,开发者直呼"生产力革命来了"! 一、…...

[特殊字符] Python 装饰器实战学习知识点梳理文档(从错题到全对版)

📚 Python 装饰器实战学习知识点梳理文档(从错题到全对版) 一、核心基础概念 ✨(装饰器的“地基”) 1. 变量作用域(避坑前提)全局变量:函数外面定义,全程序都能使用局部变…...

如何高效管理百度网盘文件:自动化批量转存与分享的完整指南

如何高效管理百度网盘文件:自动化批量转存与分享的完整指南 【免费下载链接】BaiduPanFilesTransfers 百度网盘批量转存、分享和检测工具 项目地址: https://gitcode.com/gh_mirrors/ba/BaiduPanFilesTransfers 在数字资源日益丰富的今天,百度网盘…...

N_m3u8DL-CLI-SimpleG:跨平台M3U8视频下载工具全场景应用指南

N_m3u8DL-CLI-SimpleG:跨平台M3U8视频下载工具全场景应用指南 【免费下载链接】N_m3u8DL-CLI-SimpleG N_m3u8DL-CLIs simple GUI 项目地址: https://gitcode.com/gh_mirrors/nm3/N_m3u8DL-CLI-SimpleG 一、场景定位:用户能力与需求匹配模型 三级…...

后端实战案例:企业级框架设计与优化实践

一、前言在 2026 年的软件开发中,Java 已经成为每一位工程师必须掌握的技能。无论是构建高性能后端服务、开发响应式前端界面,还是维护生产级服务器集群,这项技术都在其中扮演着关键角色。很多开发者在入门阶段会遇到一个普遍问题&#xff1a…...

基于NSGA-II多目标遗传优化算法的考虑风光火储+需求响应+P2G多能源系统多目标优化调度研究(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…...

OpenCore Legacy Patcher技术揭秘:老设备升级macOS的创新方案与实战指南

OpenCore Legacy Patcher技术揭秘:老设备升级macOS的创新方案与实战指南 【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher 在苹果生态系统中&#x…...

Windows Defender Remover完整指南:如何彻底移除Windows安全组件

Windows Defender Remover完整指南:如何彻底移除Windows安全组件 【免费下载链接】windows-defender-remover A tool which is uses to remove Windows Defender in Windows 8.x, Windows 10 (every version) and Windows 11. 项目地址: https://gitcode.com/gh_m…...

为什么传统PDF翻译总是破坏格式?BabelDOC如何5分钟实现专业文档精准翻译

为什么传统PDF翻译总是破坏格式?BabelDOC如何5分钟实现专业文档精准翻译 【免费下载链接】BabelDOC Yet Another Document Translator 项目地址: https://gitcode.com/GitHub_Trending/ba/BabelDOC 你是否曾经尝试翻译一份学术论文或技术文档,却发…...

如何通过智能辅助提升原神游戏体验:BetterGI全方位解决方案

如何通过智能辅助提升原神游戏体验:BetterGI全方位解决方案 【免费下载链接】better-genshin-impact 📦BetterGI 更好的原神 - 自动拾取 | 自动剧情 | 全自动钓鱼(AI) | 全自动七圣召唤 | 自动伐木 | 自动刷本 | 自动采集/挖矿/锄地 | 一条龙 | 全连音游…...

如何通过抖音批量下载工具实现高效内容管理与分析

如何通过抖音批量下载工具实现高效内容管理与分析 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖音批量下载…...

Java的迪米特原则介绍

01.问题思考的分析什么是迪米特原则,这个原则如何理解,如何运用到实际开发,举例说明一下?什么是高内聚松耦合,能否举例说明一下?迪米特法则。尽管它不像 SOLID、KISS、DRY 原则那样,人尽皆知&am…...

glb模型在Cesium中发黑的机理分析

最近在将一款火箭模型(fbx模式)转换为glb(gltf)格式后,在Cesium中加载结果模型看起来全黑,经过分析发现是由于高光的折射率等级(IOR level)默认设置错误(设置为0)导致的,将其设置为0.5即可在Cesium中表现正常。 现象 现有一个fbx格…...

【Epic认证级适配流程】:UE6.5.0–6.5.3全版本C++27支持矩阵,含3大禁用扩展、2个ABI断裂风险点与1份可审计迁移Checklist

第一章:Epic认证级C27适配的合规性基准与目标定义Epic Games官方于2024年Q3发布的《Unreal Engine 5.5 C Language Compliance Framework》首次将C27草案核心特性纳入引擎构建工具链的强制验证范围。本章确立的合规性基准并非仅面向语法兼容,而是聚焦于A…...

关于初次学习的c语言心得

我是一名大一下的学生,双非二本,因为一些原因休学了两年,现在正在努力学习c语言目标成为公司里面所谓的精通编程,学习c语言的过程每天坚持三小时以上,希望能进入像京东,华为等公司,我也想挣钱买…...

Windows驱动存储深度管理:DriverStore Explorer全方位解决方案

Windows驱动存储深度管理:DriverStore Explorer全方位解决方案 【免费下载链接】DriverStoreExplorer Driver Store Explorer 项目地址: https://gitcode.com/gh_mirrors/dr/DriverStoreExplorer 一、驱动管理困境与突破路径 1.1 系统驱动管理的核心挑战 W…...

Youtu-Parsing快速部署指南:一键启动Web服务,5分钟开始解析文档

Youtu-Parsing快速部署指南:一键启动Web服务,5分钟开始解析文档 1. 引言:为什么选择Youtu-Parsing 在日常工作中,我们经常需要处理各种文档——合同、报告、表格、发票等。传统的手动录入方式不仅效率低下,还容易出错…...

3个技巧让你轻松获取Steam创意工坊资源:WorkshopDL的跨平台下载解决方案

3个技巧让你轻松获取Steam创意工坊资源:WorkshopDL的跨平台下载解决方案 【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 在游戏模组爱好者的日常中,总会…...

专业级OBS模糊插件全攻略:obs-composite-blur技术解析与应用指南

专业级OBS模糊插件全攻略:obs-composite-blur技术解析与应用指南 【免费下载链接】obs-composite-blur A comprehensive blur plugin for OBS that provides several different blur algorithms, and proper compositing. 项目地址: https://gitcode.com/gh_mirro…...

ok-wuthering-waves:基于视觉识别的鸣潮智能辅助系统技术解析

ok-wuthering-waves:基于视觉识别的鸣潮智能辅助系统技术解析 【免费下载链接】ok-wuthering-waves 鸣潮 后台自动战斗 自动刷声骸 一键日常 Automation for Wuthering Waves 项目地址: https://gitcode.com/GitHub_Trending/ok/ok-wuthering-waves ok-wuthe…...

Linux 五大 I/O 模型深度解析

在构建高并发、高性能的后端系统时(如各种中间件、Web 服务器),我们不可避免地会接触到 I/O(Input/Output)模型。很多开发者对 BIO、NIO、AIO 以及多路复用等概念感到混淆。要真正从底层掌握这些模型,我们需…...

OpenClaw配置备份指南:千问3.5-27B模型迁移与快速恢复

OpenClaw配置备份指南:千问3.5-27B模型迁移与快速恢复 1. 为什么需要备份OpenClaw配置? 上周我的主力开发机突然硬盘故障,导致所有OpenClaw配置丢失。当时正在运行的3个自动化流程全部中断,最棘手的是那个每天凌晨自动整理技术文…...

用 DeepWiki 线索看 OpenClaw:它到底用到了哪些 AI 技术?

用 DeepWiki 线索看 OpenClaw:它到底用到了哪些 AI 技术? OpenClaw 近来在个人 AI 助手、Agent 框架和本地优先智能体领域里讨论度很高。很多人第一次看到它,会把它简单理解为“一个能接聊天渠道的大模型壳子”。但如果顺着 GitHub 文档以及项…...

CosyVoice语音克隆3步上手:5分钟搭建个人语音合成服务

CosyVoice语音克隆3步上手:5分钟搭建个人语音合成服务 1. 快速了解CosyVoice语音克隆 CosyVoice是由阿里巴巴通义实验室开发的多语言语音生成模型,它最吸引人的功能就是零样本声音克隆——只需要3-10秒的参考音频,就能克隆出相似度极高的合…...

VLA学习笔记——持续更新中

5 VLA - Vision-Language-Action 大模型 Vision-Language-Action(视觉 - 语言 - 动作) 大模型是之后 多模态 AI 以及机器人发展的一个非常重要的方向,有了 VLA 这位大神的加持,机器人可以完成由环境感知到动作应对的智能任务。 欢迎大家star! Paper: O…...