当前位置：首页 > news >正文

特征点检测与匹配是计算机视觉中的基础任务之一，广泛应用于图像配准、物体识别、运动估计、三维重建等领域。

news 2025/7/12 12:06:43

特征点检测与匹配是计算机视觉中的基础任务之一，广泛应用于图像配准、物体识别、运动估计、三维重建等领域。下面是一些关键的知识点：

1. 特征点检测

特征点检测的目的是从图像中找到独特的、稳定的点，这些点在图像变化（如旋转、缩放、光照变化等）中具有较好的鲁棒性。常见的特征点检测算法包括：

SIFT描述符：具有旋转和尺度不变性。
SURF描述符：加速的SIFT，计算速度更快。
ORB描述符：结合了旋转不变的BRIEF描述符，速度快且具有较好的性能。

1.1 Harris 角点检测器
Harris 角点检测器是最早的一种特征点检测方法，通过计算图像的梯度，找到角点。

import cv2
import numpy as np# 读取图像并转换为灰度图
img = cv2.imread('example.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# Harris 角点检测
gray = np.float32(gray)
dst = cv2.cornerHarris(gray, 2, 3, 0.04)# 结果通过膨胀标记角点
dst = cv2.dilate(dst, None)# 设置阈值
img[dst > 0.01 * dst.max()] = [0, 0, 255]# 显示结果
cv2.imshow('Harris Corners', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

1.2 SIFT (Scale-Invariant Feature Transform)
SIFT 是一种尺度不变特征变换算法，能够检测并描述图像中的局部特征点。

import cv2# 读取图像并转换为灰度图
img = cv2.imread('example.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 创建SIFT对象
sift = cv2.SIFT_create()# 检测关键点和计算描述符
keypoints, descriptors = sift.detectAndCompute(gray, None)# 在图像上绘制关键点
img_with_keypoints = cv2.drawKeypoints(img, keypoints, None, flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS)# 显示结果
cv2.imshow('SIFT Keypoints', img_with_keypoints)
cv2.waitKey(0)
cv2.destroyAllWindows()

1.3 ORB (Oriented FAST and Rotated BRIEF)
ORB 是一种快速且高效的特征点检测与描述算法，结合了FAST关键点检测器和BRIEF描述符。

import cv2# 读取图像并转换为灰度图
img = cv2.imread('example.jpg', cv2.IMREAD_GRAYSCALE)# 创建ORB对象
orb = cv2.ORB_create()# 检测关键点和计算描述符
keypoints, descriptors = orb.detectAndCompute(img, None)# 在图像上绘制关键点
img_with_keypoints = cv2.drawKeypoints(img, keypoints, None, color=(0, 255, 0))# 显示结果
cv2.imshow('ORB

2. 特征点匹配

特征点匹配是将一幅图像中的特征点与另一幅图像中的特征点进行匹配，以找到它们之间的对应关系。
2.1 Brute-Force匹配
Brute-Force匹配器逐一比较描述符，并找到最相似的描述符对。

import cv2# 读取图像并转换为灰度图
img1 = cv2.imread('image1.jpg', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('image2.jpg', cv2.IMREAD_GRAYSCALE)# 创建ORB对象
orb = cv2.ORB_create()# 检测关键点和计算描述符
keypoints1, descriptors1 = orb.detectAndCompute(img1, None)
keypoints2, descriptors2 = orb.detectAndCompute(img2, None)# 创建Brute-Force匹配器
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)# 进行描述符匹配
matches = bf.match(descriptors1, descriptors2)# 按距离排序
matches = sorted(matches, key=lambda x: x.distance)# 绘制匹配结果
img_matches = cv2.drawMatches(img1, keypoints1, img2, keypoints2, matches[:10], None, flags=cv2.DrawMatchesFlags_NOT_DRAW_SINGLE_POINTS)# 显示结果
cv2.imshow('ORB Matches', img_matches)
cv2.waitKey(0)
cv2.destroyAllWindows()

2.2 FLANN匹配
FLANN是快速最近邻搜索库，适用于大数据集和高维特征的匹配。

import cv2
import numpy as np# 读取图像并转换为灰度图
img1 = cv2.imread('image1.jpg', cv2.IMREAD_GRAYSCALE)
img2 = cv2.imread('image2.jpg', cv2.IMREAD_GRAYSCALE)# 创建SIFT对象
sift = cv2.SIFT_create()# 检测关键点和计算描述符
keypoints1, descriptors1 = sift.detectAndCompute(img1, None)
keypoints2, descriptors2 = sift.detectAndCompute(img2, None)# 设置FLANN匹配器参数
FLANN_INDEX_KDTREE = 1
index_params = dict(algorithm=FLANN_INDEX_KDTREE, trees=5)
search_params = dict(checks=50)# 创建FLANN匹配器
flann = cv2.FlannBasedMatcher(index_params, search_params)# 进行描述符匹配
matches = flann.knnMatch(descriptors1, descriptors2, k=2)# 仅保留距离比率小于0.7的匹配
good_matches = []
for m, n in matches:if m.distance < 0.7 * n.distance:good_matches.append(m)# 绘制匹配结果
img_matches = cv2.drawMatches(img1, keypoints1, img2, keypoints2, good_matches, None, flags=cv2.DrawMatchesFlags_NOT_DRAW_SINGLE_POINTS)# 显示结果
cv2.imshow('SIFT FLANN Matches', img_matches)
cv2.waitKey(0)
cv2.destroyAllWindows()

3.单应性矩阵

单应性矩阵（Homography Matrix）是一种用于描述两个平面间映射关系的3x3矩阵，常用于图像配准、图像拼接和透视变换等应用中。在计算机视觉中，通过计算单应性矩阵可以将一个图像中的点映射到另一个图像中的对应点，从而实现图像的对齐和变换。

计算单应性矩阵

为了计算单应性矩阵，我们需要至少四对对应的点（即源图像中的点和目标图像中的点）。OpenCV提供了cv2.findHomography函数来计算单应性矩阵。

基本步骤：

读取图像并检测特征点
匹配特征点
计算单应性矩阵
应用单应性矩阵进行图像变换

下面是一个详细的示例代码：

import cv2
import numpy as np# 读取源图像和目标图像
src_img = cv2.imread('source.jpg')
dst_img = cv2.imread('destination.jpg')# 转换为灰度图像
src_gray = cv2.cvtColor(src_img, cv2.COLOR_BGR2GRAY)
dst_gray = cv2.cvtColor(dst_img, cv2.COLOR_BGR2GRAY)# 使用ORB检测关键点和描述符
orb = cv2.ORB_create()
src_keypoints, src_descriptors = orb.detectAndCompute(src_gray, None)
dst_keypoints, dst_descriptors = orb.detectAndCompute(dst_gray, None)# 使用Brute-Force匹配器进行特征点匹配
bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
matches = bf.match(src_descriptors, dst_descriptors)# 按距离排序匹配结果
matches = sorted(matches, key=lambda x: x.distance)# 确保有足够的匹配点对
if len(matches) >= 4:# 提取匹配的点坐标src_pts = np.float32([src_keypoints[m.queryIdx].pt for m in matches]).reshape(-1, 1, 2)dst_pts = np.float32([dst_keypoints[m.trainIdx].pt for m in matches]).reshape(-1, 1, 2)# 计算单应性矩阵H, mask = cv2.findHomography(src_pts, dst_pts, cv2.RANSAC, 5.0)# 使用单应性矩阵对源图像进行透视变换height, width, channels = dst_img.shapewarped_img = cv2.warpPerspective(src_img, H, (width, height))# 显示结果cv2.imshow('Warped Image', warped_img)cv2.waitKey(0)cv2.destroyAllWindows()
else:print("Not enough matches found - {}/{}".format(len(matches), 4))

详细说明

ORB特征点检测和描述：使用ORB算法检测关键点和描述符。
特征点匹配：使用Brute-Force匹配器对检测到的特征点进行匹配。
检查匹配点对数量：在计算单应性矩阵之前，确保有足够的匹配点对（至少4对）。
计算单应性矩阵和透视变换：如果有足够的匹配点对，计算单应性矩阵并进行透视变换；否则，输出提示信息。

4.项目

用于将两张图像拼接在一起，生成一个全景图。以下是代码的主要步骤和功能：

1.读取和预处理图像：

代码首先读取了两张图片（map1.png 和 map2.png）。
然后将两张图片调整到相同的尺寸（640x480）。
2.特征点检测和匹配：
使用SIFT（Scale-Invariant Feature Transform）算法检测两张图像中的特征点，并计算特征描述子。
创建一个BFMatcher（Brute-Force Matcher）对象来进行特征匹配。
使用knnMatch方法找到两张图像中的特征点匹配对，并根据距离筛选有效的匹配点。

3.计算单应性矩阵：

通过有效的特征匹配点计算单应性矩阵（Homography Matrix），这个矩阵用于将一张图像变换到另一张图像的坐标系中。
4.图像变换与拼接：
使用单应性矩阵将第一张图像进行透视变换。
计算结果图像的尺寸，并创建一个新的大图像，将变换后的第一张图像和第二张图像拼接在一起。
5.显示结果：
最后，将拼接后的结果图像显示出来。

具体代码解释如下：

import cv2
import numpy as npdef stitch_image(img1, img2, H):# 获得原始图的高/宽h1, w1 = img1.shape[:2]h2, w2 = img2.shape[:2]# 获取图像的四个角点img1_dims = np.float32([[0,0], [0, h1], [w1, h1], [w1, 0]]).reshape(-1, 1, 2)img2_dims = np.float32([[0,0], [0, h2], [w2, h2], [w2, 0]]).reshape(-1, 1, 2)# 对第一张图像的角点进行透视变换img1_transform = cv2.perspectiveTransform(img1_dims, H)# 计算结果图像的尺寸result_dims = np.concatenate((img2_dims, img1_transform), axis=0)[x_min, y_min] = np.int32(result_dims.min(axis=0).ravel() - 0.5)[x_max, y_max] = np.int32(result_dims.max(axis=0).ravel() + 0.5)# 平移的距离transform_dist = [-x_min, -y_min]# 平移矩阵transform_array = np.array([[1, 0, transform_dist[0]],[0, 1, transform_dist[1]],[0, 0, 1]])# 对第一张图像进行透视变换和平移result_img = cv2.warpPerspective(img1, transform_array.dot(H), (x_max-x_min, y_max-y_min))# 将第二张图像拼接到结果图像上result_img[transform_dist[1]:transform_dist[1]+h2, transform_dist[0]:transform_dist[0]+w2] = img2return result_imgdef get_homo(img1, img2):# 创建SIFT特征检测对象sift = cv2.xfeatures2d.SIFT_create()# 检测特征点和计算描述子k1, d1 = sift.detectAndCompute(img1, None)k2, d2 = sift.detectAndCompute(img2, None)# 创建特征匹配器bf = cv2.BFMatcher()matches = bf.knnMatch(d1, d2, k=2)# 过滤特征匹配点verify_ratio = 0.8verify_matches = []for m1, m2 in matches:if m1.distance < 0.8 * m2.distance:verify_matches.append(m1)min_matches = 8if len(verify_matches) > min_matches:img1_pts = []img2_pts = []for m in verify_matches:img1_pts.append(k1[m.queryIdx].pt)img2_pts.append(k2[m.trainIdx].pt)img1_pts = np.float32(img1_pts).reshape(-1, 1, 2)img2_pts = np.float32(img2_pts).reshape(-1, 1, 2)# 计算单应性矩阵H, mask = cv2.findHomography(img1_pts, img2_pts, cv2.RANSAC, 5.0)return Helse:print('err: Not enough matches!')exit()# 读取两张图片
img1 = cv2.imread('map1.png')
img2 = cv2.imread('map2.png')# 将两张图片设置成同样大小
img1 = cv2.resize(img1, (640, 480))
img2 = cv2.resize(img2, (640, 480))inputs = np.hstack((img1, img2))# 获得单应性矩阵
H = get_homo(img1, img2)# 进行图像拼接
result_image = stitch_image(img1, img2, H)cv2.imshow('input img', result_image)
cv2.waitKey()

特征点检测与匹配是计算机视觉中的基础任务之一，广泛应用于图像配准、物体识别、运动估计、三维重建等领域。

特征点检测与匹配是计算机视觉中的基础任务之一，广泛应用于图像配准、物体识别、运动估计、三维重建等领域。下面是一些关键的知识点： 1. 特征点检测特征点检测的目的是从图像中找到独特的、稳定的点，这些点在图像变化（如旋转、…...

编程日记 2024/10/8 9:37:30

python——Echarts现交互式动态可视化

数据展示 20192018201720162015201420132012北京5817.15785.91765430.78755081.264723.864027.16093661.10973314.934天津2410.252106.23972310.35522723.52667.112390.35182079.07161760.0201河北3742.673513.86433233.83322849.872649.182446.61662295.62032084.2825山西234…...

编程日记 2024/10/8 9:36:29

【含开题报告+文档+PPT+源码】基于SSM框架的民宿酒店预定系统的设计与实现

开题报告随着人们旅游需求的增加，民宿行业呈现出快速发展的趋势。传统的住宿方式逐渐无法满足人们对个性化、舒适、便捷的需求，而民宿作为一种新型的住宿选择，逐渐受到人们的青睐。民宿的特点是具有独特的风格、便捷的地理位置、相对亲近的…...

编程日记 2024/10/8 9:35:27

正确理解协程

import asyncio# 定义一个异步函数（协程） async def say_after(delay, what):# 等待指定的时间await asyncio.sleep(delay)# 打印消息print(what)# 定义另一个异步函数 async def main():# 同时启动两个协程，并等待这2个协程结束await say_af…...

编程日记 2024/10/8 9:34:26

蒙特卡罗方法 - 采样和蒙特卡罗方法篇

序言蒙特卡罗（ Monte Carlo \text{Monte Carlo} Monte Carlo）方法，也被称为计算机随机模拟方法，是一种基于“随机数”的计算方法。这一方法源于美国在第二次世界大战期间研制原子弹的“曼哈顿计划”。其核心思想是使用随机数&am…...

编程日记 2024/10/8 9:33:25

论文阅读：InternVL v1.5| How Far Are We to GPT-4V? 通过开源模型缩小与商业多模式模型的差距

论文地址：https://arxiv.org/abs/2404.16821 Demo： https://internvl.opengvlab.com Model：https://huggingface.co/OpenGVLab/InternVL-Chat-V1-5 公开时间：2024年4月29日 InternVL1.5，是一个开源的多模态大型语言模…...

编程日记 2024/10/8 9:32:23

什么是电能表PTB认证

电能表PTB认证是指电能表产品经过德国国家计量研究所（Physikalisch-Technische Bundesanstalt，简称PTB）的认证和审核过程。PTB是德国联邦政府在计量、物理、材料和测试领域的技术专家和合作伙伴，拥有世界领先的技术水平和专业知识…...

编程日记 2024/10/8 9:30:20

C# 单例模式继承

简介：单例模式是软件工程中最著名的模式之一。从本质上讲，singleton 是一个只允许创建自身的单个实例的类，并且通常提供对该实例的简单访问。最常见的是，单例不允许在创建实例时指定任何参数 - 否则，对实例进行第二次请…...

编程日记 2024/10/8 9:26:14

ESP8266模块（WIFI STM32）

目录一、介绍二、传感器原理 1.原理图 2.引脚描述 3.ESP8266基础AT指令介绍 4.ESP8266基础工作模式三、程序设计 main.c文件 esp8266.h文件 esp8266.c文件四、实验效果五、资料获取项目分享一、介绍 ESP8266是一款嵌入式系统级芯片，它集成了Wi…...

编程日记 2024/10/8 9:24:09

微信小程序学习实录9：掌握wx.chooseMedia实现多图片文件上传功能（选择图片、预览图片、上传图片）

要实现多图片上传到服务器，需要在小程序前端和PHP后端分别进行相应的设置。基本流程微信小程序提供了丰富的API来支持多图片上传功能。在微信小程序中实现多图片的选择、预览以及上传到服务器的功能： 1. 选择图片使用 wx.chooseImage API 可以让用…...

编程日记 2024/10/8 9:23:08

助动词的分类及其缩略形式

助动词的分类及其缩略形式 1. 助动词 (auxiliary verb)2. 基本助动词 (primary auxiliary)2.1. 基本助动词 be、do 和 have2.2. 实义动词 be、do 和 have 3. 情态助动词 (modal auxiliary)3.1. 情态助动词取代情态动词 4. 半助动词 (semi-auxiliary)4.1. 不能与 it ... that-cl…...

编程日记 2024/10/8 9:20:03

Redis——分布式锁

在一个分布式系统中，只要涉及到多个节点访问同一个公共资源的时候，就需要加锁来实现互斥，从而达到线程安全的问题。但是呢，分布式系统不同一些，因为分布式系统部署在不同的服务器上，很可能大量的请求打到…...

编程日记 2024/10/8 9:19:02

C++面试速通宝典——13

208. class里面定义int a，如果不实现构造函数，实例化这个类，a的值是？ ‌‌‌‌　　答：a的值是未定义的（在C标准中成为“未初始化”）。解释： ‌‌‌‌　　在C中，如果一…...

编程日记 2024/10/8 9:18:01

数据结构（二叉树）

1. 树相关术语父结点/双亲结点：如果一个结点有子结点那么它就是父结点或者双亲结点；例如A是BCDEFG的父结点，J是PQ的父结点等等；子结点：一个结点含有的子树的根节点称为该结点的子结点；如上图的H是D的子结点…...

编程日记 2024/10/8 9:10:50

Windows 通过 Docker 安装 GitLab

1. 安装 Docker Desktop 下载网站：Windows | Docker Docs 2. 拉取 GitLab Docker 镜像打开 PowerShell 或命令提示符，拉取 GitLab 镜像： docker pull gitlab/gitlab-ee:latest或则使用社区版： docker pull gitlab/gitlab-ce…...

编程日记 2024/10/8 9:05:43

SQL专项练习第六天

Hive 在处理不同数据需求时的灵活性和强大功能，包括间隔连续问题的处理、行列转换、交易数据查询、用户登录统计以及专利数据分析等方面。本文将介绍五个 Hive 数据处理问题的解决方案，并通过实际案例进行演示。先在home文件夹下建一个hivedata文件夹&a…...

编程日记 2024/10/8 8:59:36

CSS——属性值计算

CSS——属性值计算今天来详细讲解一下 CSS的属性值计算过程，这是 CSS 的核心之一（另一个是视觉可视化模型，个人理解，这个相对复杂，以后再讲）。基本概念层叠样式表：Cascade Style Sheet&am…...

编程日记 2024/10/8 8:58:34

408算法题leetcode--第26天

496. 下一个更大元素 I 题目地址：496. 下一个更大元素 I - 力扣（LeetCode） 题解思路：单调栈，如注释时间复杂度：O(n m) 空间复杂度：O(n) 代码: class Solution { public:vector<int&g…...

编程日记 2024/10/8 8:54:28

JavaScript 与浏览器存储

JavaScript提供了两种存储数据的方式：LocalStorage和SessionStorage。这两种方式都是浏览器提供的客户端存储解决方案，可以将数据保存在用户的浏览器中，供网站使用。 LocalStorage和SessionStorage的区别在于数据的作用域和生命周期。 Loca…...

编程日记 2024/10/8 8:53:26

Chromium 如何查找已经定义好的mojom函数实现c++

进程通信定义通常都是用.mojom文件或者idl文件格式以content\common\frame.mojom里面的BeginNavigation函数为例。一、如何查找BeginNavigation函数定义，在vscode里面直接搜索BeginNavigation，过滤条件 *.idl,*.mojom,*.cc 效果： 这样…...

编程日记 2024/10/8 8:52:25

相机Camera日志实例分析之二：相机Camx【专业模式开启直方图拍照】单帧流程日志详解

【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了： 这一篇我们开始讲： 目录一、场景操作步骤二、日志基础关键字分级如下三、场景日志如下： 一、场景操作步骤操作步…...

编程新知 2025/7/10 22:40:01

解决Ubuntu22.04 VMware失败的问题 ubuntu入门之二十八

现象1 打开VMware失败 Ubuntu升级之后打开VMware上报需要安装vmmon和vmnet，点击确认后如下提示最终上报fail 解决方法内核升级导致，需要在新内核下重新下载编译安装查看版本 $ vmware -v VMware Workstation 17.5.1 build-23298084$ lsb_release…...

编程新知 2025/7/10 10:28:03

CMake 从 GitHub 下载第三方库并使用

有时我们希望直接使用 GitHub 上的开源库，而不想手动下载、编译和安装。可以利用 CMake 提供的 FetchContent 模块来实现自动下载、构建和链接第三方库。 FetchContent 命令官方文档✅ 示例代码我们将以 fmt 这个流行的格式化库为例，演示如何：使用 FetchContent 从 GitH…...

编程新知 2025/7/8 19:51:41

3403. 从盒子中找出字典序最大的字符串 I

3403. 从盒子中找出字典序最大的字符串 I 题目链接：3403. 从盒子中找出字典序最大的字符串 I 代码如下： class Solution { public:string answerString(string word, int numFriends) {if (numFriends 1) {return word;}string res;for (int i 0;i &…...

编程新知 2025/6/21 22:11:13

（转）什么是DockerCompose?它有什么作用？

一、什么是DockerCompose? DockerCompose可以基于Compose文件帮我们快速的部署分布式应用，而无需手动一个个创建和运行容器。 Compose文件是一个文本文件，通过指令定义集群中的每个容器如何运行。 DockerCompose就是把DockerFile转换成指令去运行。 …...

编程新知 2025/7/12 2:28:11

.Net Framework 4/C# 关键字（非常用，持续更新...）

一、is 关键字 is 关键字用于检查对象是否于给定类型兼容，如果兼容将返回 true，如果不兼容则返回 false，在进行类型转换前，可以先使用 is 关键字判断对象是否与指定类型兼容，如果兼容才进行转换，这样的转换是安全的。例如有：首先创建一个字符串对象，然后将字符串对象隐…...

编程新知 2025/6/25 1:12:20

Java 二维码

Java 二维码 **技术：**谷歌 ZXing 实现首先添加依赖 <dependency><groupId>com.google.zxing</groupId><artifactId>core</artifactId><version>3.5.1</version></dependency><de…...

编程新知 2025/6/21 12:56:10

视觉slam十四讲实践部分记录——ch2、ch3

ch2 一、使用g++编译.cpp为可执行文件并运行(P30) g++ helloSLAM.cpp ./a.out运行二、使用cmake编译 mkdir build cd build cmake .. makeCMakeCache.txt 文件仍然指向旧的目录。这表明在源代码目录中可能还存在旧的 CMakeCache.txt 文件，或者在构建过程中仍然引用了旧的路…...

编程新知 2025/7/12 9:45:38

人机融合智能 | “人智交互”跨学科新领域

本文系统地提出基于“以人为中心AI(HCAI)”理念的人-人工智能交互(人智交互)这一跨学科新领域及框架,定义人智交互领域的理念、基本理论和关键问题、方法、开发流程和参与团队等,阐述提出人智交互新领域的意义。然后,提出人智交互研究的三种新范式取向以及它们的意义。最后,总结…...

编程新知 2025/7/11 2:40:59

Python 高效图像帧提取与视频编码：实战指南

Python 高效图像帧提取与视频编码：实战指南在音视频处理领域，图像帧提取与视频编码是基础但极具挑战性的任务。Python 结合强大的第三方库（如 OpenCV、FFmpeg、PyAV），可以高效处理视频流，实现快速帧提取、压缩编码等关键功能。本文将深入介绍如何优化这些流程，提高处理…...

编程新知 2025/7/7 13:13:31