当前位置：首页 > news >正文

图像特征描述和人脸识别

news 2026/2/10 13:40:33

CV_tutorial2

特征检测
- 使用HOG实现行人检测
- Harris角点检测
- 关键特征检测SIFT
- 纹理特征 LBP算法
模板匹配
人脸识别

特征检测

使用HOG实现行人检测

HOG方向梯度直方图

实现过程：

灰度化（为了去掉颜色、光照对形状的影响）;
采用Gamma校正法对输入图像进行颜色空间的标准化（使得图像输入更符合肉眼看上去更加柔和的状态）;
计算每个像素的梯度，包括方向和大小;
将图像划分成小cells;
统计每个cell的梯度直方图，得到cell的描述子；
将每几个cell组成一个block，得到block的描述子；
将图像image内的所有block的HOG特征descriptor串联起来就可以得到HOG特征，该特征向量就是用来目标检测或分类的特征。

import cv2
import numpy as np
# 判断矩形i是否完全包含在矩形o中
def is_inside(o, i):ox, oy, ow, oh = 0ix, iy, iw, ih = ireturn ox > ix and oy > iy and ox+ow < ix+iw and oy+oh < iy+ih# 对人体绘制颜色框
def draw_person(image, person):x, y, w, h = personcv2.rectangle(image, (x,y), (x+w, y+h), (0,0,255), 1)
img = cv2.imread("person.png")
hog = cv2.HOGDescriptor() # 启动检测器对象
hog.setSVMDetector(cv2.HOGDescriptor_getDefaultPeopleDetector()) # 指定检测器类型为人体
found, w = hog.detectMultiScale(img, 0.1, (1,1)) # 加载并检测对象
print(found)# 丢弃某些完全被其它矩形包含在内的矩形，即其他都加入队列里
found_filtered = []
for ri, r in enumerate(found):for qi, q in enumerate(found):if ri != qi and is_inside(r, q):breakelse:found_filtered.append(r)print(found_filtered)
# 对其他有效矩形进行框定
for person in person_filtered:draw_person(img, person)
cv2.imshow("person detection", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

行人检测结果：
在这里插入图片描述
换了其他图片，发现这是效果最好的一张☝️

Harris角点检测

实现过程：

计算图像在x和y方向的梯度
计算图像两个方向的梯度的乘积
使用高斯函数对三者进行高斯加权，生成矩阵M的A, B, C
计算每个像素的Harris响应值R，并对小于某一阈值t的R置为零
在3x3或5x5的邻域内进行非最大值抑制，局部最大值点即为图像的角点

import cv2
import numpy as np
img = cv2.imread("img.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
gray = np.float32(gray) # 转换成numpy矩阵# 输入图像必须是float32，blockSize，kernelsize，最后一个自由参数
#（经验取值在0.03~0.06之间）
dst = cv2.cornerHarris(gray, 2, 3, 0.03)# 设定角点阈值，不同图像阈值不同
# 将角点用红色标注
img[dst>0.01*dst.max()]=[0, 0, 255]
# print(dst.max()) # 533091900.0
cv2.imshow("dst_img",img)
cv2.waitKey(0)
cv2.destryAllWindows()

角点检测：
在原图上进行角点标注：

可以对角点进行膨胀，看得更清楚：
dst = cv2.dilate(dst,None)
单纯使用Harris的话，稍微复杂一点检测效果不佳

关键特征检测SIFT

Scale-invariant feature transform, 尺度不变特征变换算法
实现过程：

尺度空间极值检测点检测
关键点定位：去除一些不好的特征点
关键点方向参数：获取关键点所在尺度空间的邻域，然后计算该区域的梯度和方向，根据计算结果创建方向直方图，直方图的峰值为主方向的参数
关键点描述：每个关键点用一组向量（位置、尺度、方向）将这个关键点描述出来，使其不随着光照、视角等等影响而改变【优势】
关键点匹配：分别对模板图和实时图建立关键点描述符集合，通过对比关键点描述符来判断两个关键点是否相同

OpenCV > 4.0受到专利限制移除了xfeatures2d函数

import cv2
import numpy as np
img = cv2.imread("1.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)sift = cv2.xfeatures2d.SIFT_create()
kp = sift.detect(gray, None) # 找到关键点
img = cv2.drawKeypoints(gray, kp, img) # 绘制关键点cv2.imshow('sp', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

纹理特征 LBP算法

Local Binary Pattern, 局部二值模式
LBP算子定义在3X3的窗口内，以窗口中心为阈值，与相邻的8个像素的灰度值比较，若周围的像素值大于中心像素值，则该位置被标为1；否则标记为0。

def LBP(src):height = src.shape[0]width = src.shape[1]dst = src.copy() # 浅拷贝lbp_value = np.zeros((1, 8), dtype=np.uint8)neighbours = np.zeros((1, 8), dtype=np.uint8)for x in range(1, width-1):for y in range(1, height-1):neighbours[0, 0] = src[y - 1, x - 1]neighbours[0, 1] = src[y - 1, x]neighbours[0, 2] = src[y - 1, x + 1]neighbours[0, 3] = src[y, x - 1]neighbours[0, 4] = src[y, x + 1]neighbours[0, 5] = src[y + 1, x - 1]neighbours[0, 6] = src[y + 1, x]neighbours[0, 7] = src[y + 1, x + 1]center = src[y, x]for i in range(8):if neighbours[0, i] > center:lbp_value[0, i] = 1else:lbp_value[0, i] = 0# 计算lbp值(即二进制到十进制)lbp = lbp_value[0, 0] * 1 + lbp_value[0, 1] * 2 + lbp_value[0, 2] * 4 + lbp_value[0, 3] * 8 \+ lbp_value[0, 4] * 16 + lbp_value[0, 5] * 32 + lbp_value[0, 6] * 64 + lbp_value[0, 7] * 128# 将中心值改为lbp值dst[y, x] = lbpreturn dstimport cv2
import numpy as np
img = cv2.imread('building.png', 0) # 以单通道读入图像
# 看下源图
cv2.imshow('src',img)
cv2.waitKey(0)
cv2.destroyAllWindows()new_img = LBP(img)cv2.imshow('lbp',new_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

模板匹配

人脸识别

一个完整的人脸识别系统一般包含4个主要组成部分：

人脸检测（人脸位置）Face Detect
人脸对齐（五官位置）Face Alignment
人脸特征提取（抽象为字符串信息）Face Feature Extraction
人脸识别（计算相似度，确认身份）Face Recognition

OpenCV封装的人脸检测方法

import cv2img = cv2.imread("1.png")
# 检测器，加载人脸特征（该文件在python安装目录下）
face_cascade = cv2.CascadeClassifier(r'haaracascade_frontalface_default.xml')
# 灰度图减少计算强度（避免颜色干扰）
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 检测的一个人脸坐标[x,y,w,h]是一个list，所以list的数量就是人脸数量
faces = face_cascade.detectMultiScale(gray, scaleFactor = 1.15, minNeighbors = 4, minSize = (5, 5))
print("Faces:{0}".format(len(faces)))# 用矩形圈出人脸的位置（提供左上角和右下角坐标）
for(x, y, w, h) in faces:cv2.rectangle(img, (x, y), (x + w, y + h), (0, 0, 255), 2)cv2.imshow("Faces", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

Face : 1

通过其他照片的试验，OpenCV自带的方法和dilb对于标准正脸检测OK的，但是对于侧脸（不同角度）以及低像素基本完全不OK

使用dlib中的方法

# -*- coding：utf-8 -*-
import cv2
import dlib
import numpy as nppredictor_model = 'shape_predictor_68_face_landmarks/shape_predictor_68_face_landmarks.dat'
detector = dlib.get_frontal_face_detector()
predictor = dlib.shape_predictor(predictor_model)

dlib库没办法直接pip安装
找python3.8对应的dlib的轮子找了好一会儿，放百度盘了需要自取

许多博客尤其是~~CSDN~~，免费开源的放自己文章里收费😅，很不友好，目前还是习惯在这里记一些流水帐笔记😞

图像特征描述和人脸识别

CV_tutorial2 特征检测使用HOG实现行人检测Harris角点检测关键特征检测SIFT纹理特征 LBP算法模板匹配人脸识别特征检测使用HOG实现行人检测 HOG方向梯度直方图实现过程： 灰度化（为了去掉颜色、光照对形状的影响）;采用Gamma校正法对输…...

编程日记 2023/8/28 15:16:43

浅谈Lua协程和函数的尾调用

前言虽然不经常用到协程，但是也不能谈虎色变。同时，在有些场景，协程会起到一种不可比拟的作用。所以，了解它，对于一些功能，也会有独特的思路和想法。协程概念关于进程和线程的概念就不多说。那么…...

编程日记 2023/8/28 15:15:42

【VS Code插件开发】状态栏（五）

🐱 个人主页：不叫猫先生，公众号：前端舵手 🙋‍♂️ 作者简介：前端领域优质作者、阿里云专家博主，共同学习共同进步，一起加油呀！ 📢 资料领取：前端…...

编程日记 2023/8/28 15:14:39

睿趣科技：抖音开网店要怎么找货源

在当今数字化的时代，电商平台的兴起为越来越多的人提供了开设网店的机会，而抖音作为一个充满活力的短视频平台，也为创业者提供了广阔的发展空间。然而，对于许多初次涉足电商领域的人来说，找到合适的货源却是一个重要的…...

编程日记 2023/8/28 15:13:38

表和Json的相互操作

目录一、表转Json 1.使用 for json path 2.如何返回单个Json 3.如何给返回的Json增加一个根节点呢 4.如何给返回的Json增加上一个节点二、对Json基本操作 1.判断给的字符串是否是Json格式 2.从 JSON 字符串中提取标量值 3. 从 JSON 字符串中提取对象或数组 4. 更…...

编程日记 2023/8/28 15:12:34

每日后端面试5题第八天

1.UDP和TCP协议的区别 1.UDP无连接，速度快，安全性低，适合高速传输、实时广播通信等。 2.TCP面向连接，速度慢，安全性高，适合传输质量要求高、大文件等的传输，比如邮件发送等。 （还…...

编程日记 2023/8/28 15:11:33

mysql数据库和数据表

常用的数据类型: int ： 整型用于定义整数类型的数据float ： 单精度浮点4字节32位准确表示到小数点后六位.double ：双精度浮点8字节64位char ：固定长度的字符类型用于定义字符类型数据varchar ：可变长度的字符类…...

编程日记 2023/8/28 15:10:32

MySQL执行更新的流程

一、加载缓存数据引擎要执行更新语句的时候 ，比如对“id10”这一行数据，他其实会先将“id10”这一行数据看看是否在缓冲池里，如果不在的话，那么会直接从磁盘里加载到缓冲池里来，而且接着还会对这行记录加独占锁。二…...

编程日记 2023/8/28 15:09:31

要获取 PHP 中当前时间的前一天、本周、本月、本季度和本年，可以使用 PHP 的内置日期和时间函数。

要获取 PHP 中当前时间的前一天、本周、本月、本季度和本年，可以使用 PHP 的内置日期和时间函数。下面是一些示例代码来帮助你实现这些功能： php // 获取当前时间的前一天 $yesterday date(Y-m-d, strtotime(-1 day));// 获取本周的开始日期和结束日期…...

编程日记 2023/8/28 15:08:30

java八股文面试[java基础]——如何实现不可变的类

知识来源： 【23版面试突击】如何实现不可变的类？_哔哩哔哩_bilibili 【2023年面试】怎样声明一个类不会被继承，什么场景下会用_哔哩哔哩_bilibili...

编程日记 2023/8/28 15:07:28

juc基础（四）

目录一、ThreadPool 线程池 1、参数说明 2、拒绝策略 3、线程池种类 （1）newCachedThreadPool(常用) （2）newFixedThreadPool(常用) （3）newSingleThreadExecutor(常用) （4）ne…...

编程日记 2023/8/28 15:06:26

C++智能指针weak_ptr的作用

当使用std::shared_ptr时，循环引用可能会导致资源泄漏的问题。下面是一个简单的示例，展示了循环引用导致资源泄漏的情况： #include <iostream> #include <memory>class A; class B;class A { public:std::shared_ptr<B> b…...

编程日记 2023/8/28 15:05:25

lintcode 344 · 歌曲时间【背包问题，动态规划】

题目链接，描述 https://www.lintcode.com/problem/344/ 给定长度为N的正整数数组song代表N首歌的时间请你任选其中若干首播放，在满足开始播放最后一首歌的时间小于M的情况下求播放歌曲的最长时间每首歌只能被播放一次你可以任意指定播放顺序1 \leq …...

编程日记 2023/8/28 15:04:24

Qt应用开发(基础篇)——对话框窗口 QDialog

一、前言 QDialog类继承于QWidget，是Qt基于对话框窗口(消息窗口QMessageBox、颜色选择窗口QColorDialog、文件选择窗口QFileDialog等)的基类。 QDialog窗口是顶级的窗口，一般情况下，用来当做用户短期任务(确认、输入、选择)或者和用户交流(提…...

编程日记 2023/8/28 15:03:22

Linux系统：CentOS 7 CA证书服务器部署

目录一、理论 1.CA认证中心 2.CA证书服务器部署二、实验 1. CA证书服务器部署三、总结一、理论 1.CA认证中心 （1）概念 CA ：CertificateAuthority的缩写，通常翻译成认证权威或者认证中心，主要用途是为用户…...

编程日记 2023/8/28 15:02:21

C++图形界面编程-MFC

C控制台程序是命令行黑框，如果要写一个图形界面，VS也提供了图形界面编程MFC。建项目的时候选如下选项： 类似于QT。问：那么MFC项目的运行入口main()或WinMain()在哪里呢？ 答：其实，在MFC应用程…...

编程日记 2023/8/28 15:01:19

知识扩展贴圆越大,其圆接触的无知面就越多

CSDN 排行榜 https://blog.csdn.net/rank/list/total?spm1001.2014.3001.5476 顺其自然~_-CSDN博客...

编程日记 2023/8/28 15:00:17

怎么把pdf转换成jpg格式？

怎么把pdf转换成jpg格式？在我们日常的办公过程中，PDF文件是一个经常被使用来传输文件的格式。它能够确保我们的文件内容不会混乱，并以更加完美的方式呈现出来。然而，PDF文件也存在一些缺陷。例如，它无法直接编辑&#…...

编程日记 2023/8/28 14:59:16

Android SDK 上手指南||第六章用户交互

第六章用户交互在这篇教程中，我们将对之前所添加的Button元素进行设置以实现对用户点击的检测与响应。为了达成这一目标，我们需要在应用程序的主 Activity类中略微涉及Java编程内容。如果大家在Java开发方面的经验不太丰富也没必要担心，只…...

编程日记 2023/8/28 14:58:15

Vue3+Pinia+Koa+Three.js 全栈电商项目总结复盘

前言前几天一个朋友去义乌旅游，带回来很多小商品，就是一整个物美价廉，但是为什么线下购物和网购有的时候差别这么大（网购经常要退换货啊😭😭😭），为此我萌生了一个想法&…...

编程日记 2023/8/28 14:57:14

1. Android wifi 关键日志总结 (1) Wi-Fi 断开 (CTRL-EVENT-DISCONNECTED reason3) 日志相关部分： 06-05 10:48:40.987 943 943 I wpa_supplicant: wlan0: CTRL-EVENT-DISCONNECTED bssid44:9b:c1:57:a8:90 reason3 locally_generated1解析： CTR…...

编程新知 2025/9/14 19:44:52

springboot 百货中心供应链管理系统小程序

一、前言随着我国经济迅速发展，人们对手机的需求越来越大，各种手机软件也都在被广泛应用，但是对于手机进行数据信息管理，对于手机的各种软件也是备受用户的喜爱，百货中心供应链管理系统被用户普遍使用，为方…...

编程新知 2026/2/8 20:41:49

Debian系统简介

目录 Debian系统介绍 Debian版本介绍 Debian软件源介绍软件包管理工具dpkg dpkg核心指令详解安装软件包卸载软件包查询软件包状态验证软件包完整性手动处理依赖关系 dpkg vs apt Debian系统介绍 Debian 和 Ubuntu 都是基于 Debian内核的 Linux 发行版&#xff…...

编程新知 2026/2/1 13:41:09

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

蛋白质结合剂（如抗体、抑制肽）在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上，高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术，但这类方法普遍面临资源消耗巨大、研发周期冗长…...

编程新知 2026/1/25 13:18:12

TRS收益互换：跨境资本流动的金融创新工具与系统化解决方案

一、TRS收益互换的本质与业务逻辑 （一）概念解析 TRS（Total Return Swap）收益互换是一种金融衍生工具，指交易双方约定在未来一定期限内，基于特定资产或指数的表现进行现金流交换的协议。其核心特征包括&am…...

编程新知 2025/11/2 0:31:23

C++中string流知识详解和示例

一、概览与类体系 C 提供三种基于内存字符串的流，定义在 <sstream> 中： std::istringstream：输入流，从已有字符串中读取并解析。std::ostringstream：输出流，向内部缓冲区写入内容，最终取…...

编程新知 2025/11/30 11:30:47

Axios请求超时重发机制

Axios 超时重新请求实现方案在 Axios 中实现超时重新请求可以通过以下几种方式： 1. 使用拦截器实现自动重试 import axios from axios;// 创建axios实例 const instance axios.create();// 设置超时时间 instance.defaults.timeout 5000;// 最大重试次数 cons…...

编程新知 2025/10/13 2:26:14

（转）什么是DockerCompose?它有什么作用？

一、什么是DockerCompose? DockerCompose可以基于Compose文件帮我们快速的部署分布式应用，而无需手动一个个创建和运行容器。 Compose文件是一个文本文件，通过指令定义集群中的每个容器如何运行。 DockerCompose就是把DockerFile转换成指令去运行。 …...

编程新知 2026/1/31 22:59:12

Mobile ALOHA全身模仿学习

一、题目 Mobile ALOHA：通过低成本全身远程操作学习双手移动操作传统模仿学习（Imitation Learning）缺点：聚焦与桌面操作，缺乏通用任务所需的移动性和灵活性本论文优点：（1）在ALOHA…...

编程新知 2026/1/27 14:18:20

【Java学习笔记】BigInteger 和 BigDecimal 类

BigInteger 和 BigDecimal 类二者共有的常见方法方法功能add加subtract减multiply乘divide除注意点：传参类型必须是类对象一、BigInteger 1. 作用：适合保存比较大的整型数 2. 使用说明创建BigInteger对象传入字符串 3. 代码示例 import j…...

编程新知 2025/11/8 15:39:00

图像特征描述和人脸识别

CV_tutorial2

特征检测

使用HOG实现行人检测

Harris角点检测

关键特征检测SIFT

纹理特征 LBP算法

模板匹配

人脸识别

相关文章：

图像特征描述和人脸识别

浅谈Lua协程和函数的尾调用

【VS Code插件开发】状态栏（五）

睿趣科技：抖音开网店要怎么找货源

表和Json的相互操作

每日后端面试5题第八天

mysql数据库和数据表

MySQL执行更新的流程

要获取 PHP 中当前时间的前一天、本周、本月、本季度和本年，可以使用 PHP 的内置日期和时间函数。

java八股文面试[java基础]——如何实现不可变的类

juc基础（四）

C++智能指针weak_ptr的作用

lintcode 344 · 歌曲时间【背包问题，动态规划】

Qt应用开发(基础篇)——对话框窗口 QDialog

Linux系统：CentOS 7 CA证书服务器部署

C++图形界面编程-MFC

知识扩展贴圆越大,其圆接触的无知面就越多

怎么把pdf转换成jpg格式？

Android SDK 上手指南||第六章用户交互

Vue3+Pinia+Koa+Three.js 全栈电商项目总结复盘

Android Wi-Fi 连接失败日志分析

springboot 百货中心供应链管理系统小程序

Debian系统简介

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

TRS收益互换：跨境资本流动的金融创新工具与系统化解决方案

C++中string流知识详解和示例

Axios请求超时重发机制

（转）什么是DockerCompose?它有什么作用？

Mobile ALOHA全身模仿学习

【Java学习笔记】BigInteger 和 BigDecimal 类